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ul 


PostgreSQL 宣称 自己 是 世界 上 最 先进 的 开源 数据 库 。 我 们 非常 赞同 这 种 说 法 。 

我 们 希望 本 书 能 帮助 读者 在 PostgreSQL 的 核心 概念 与 功能 特性 等 方面 打下 坚实 的 基础 ， 正 
是 这 些 先进 的 概念 与 功能 特性 使 得 这 款 数据 库 如 此 杰出 和 与 众 不 同 。 同 时 我 们 将 使 读者 相 
信 ，PostgreSQL “最 先进 的 开源 数据 库 ” 这 一 称号 是 实 至 名 归 的 。 这 款 数据 库 体 系 庞 大 、 
功能 先进 ， 因 此 如 果 一 本 书 试图 将 其 强大 特性 介绍 清楚 ， 其 篇 幅 一 定 不 会 少 于 3500 页 。 
事实 上 ， 大 多 数 用 户 并 不 需要 摸 透 它 所 有 复杂 深奥 的 高 级 功能 ， 因 此 在 这 本 不 到 300 页 的 
书 中 ， 我 们 希望 能 够 帮助 读者 提纲 者 领 抓 住 要 点 ， 从 而 做 到 像 本 书 书 名 所 宣称 的 那样 
即 学 即 用 。 
本 书 在 介绍 每 个 功能 点 的 同时 都 会 附带 其 适用 的 上 下 文 场 景 ， 这 样 读者 就 可 以 了 解 每 个 
功能 点 的 适用 范围 以 及 功能 表现 。 我 们 假设 读者 已 经 具备 了 其 他 数据 库 的 使 用 经 验 ， 这 
样 我 们 就 可 以 直 奔 主题 ， 介 绍 PostgreSQL 的 关键 功能 点 ， 而 不 必 在 预先 普及 数据 库 基础 
知识 上 浪费 时 间 。 我 们 在 一 些 必 要 的 地 方 附 上 了 相关 资源 ， 以 便于 读者 深入 钻研 感 兴 
的 功能 点 。 这 些 资源 的 内 容 多 种 多 样 ， 比 如 官方 手册 的 特定 章节 、 网 上 有 帮助 的 文章 以 
及 PostgreSQL 大 牛 们 的 博客 文章 等 ， 当 然 也 包括 我 们 自己 的 官网 Postgre Online Journal 
上 的 一 些 文章 ， 这 个 网 站 上 有 我 们 自己 编写 的 很 多 PostgreSQL 相关 文章 ， 也 有 一 些 研 究 
PostgreSQL 与 其 他 应 用 之 间 互 操作 性 的 文章 。 

本 书 主要 介绍 PostgreSQL 9.5、PostgreSQL 9.6 以 及 PostgreSQL 10， 但 也 会 涉及 之 前 版 本 
中 一 些 独特 的 高 级 特性 。 


本 书 读者 


对 于 从 其 他 数据 库 引 擎 迁移 到 PostgreSQL 的 读者 来 说 ， 我 们 将 在 本 书 中 列 出 其 他 数据 库 的 
高 级 特性 在 PostgreSQL 中 的 实现 方法 。 更 重要 的 是 ， 我 们 会 重点 介绍 一 些 在 PostgreSQL 
中 可 以 实现 而 在 其 他 数据 库 中 很 难 或 者 不 可 能 实现 的 高 级 功能 。 
本 书 不 会 教 读者 怎么 写 SQL， 相 关 学 习 资 料 有 很 多 ， 因 此 这 不 是 本 书 的 重点 。 学 习 SQL 
就 像 学 习 下 棋 一 一 儿 个 小 时 就 能 了 解 基本 规则 ， 但 要 熟练 掌握 却 需 要 终身 持续 学 习 。 你 会 
发 现 选择 PostgreSQL 是 一 个 明智 的 决定 ， 并 将 因此 而 受益 终身 。 
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如 果 你 是 对 PostgreSQL 非常 熟悉 的 老 用 户 或 者 是 经 验 丰富 的 DBA， 那 么 本 书 中 的 大 量 内 
容 你 都 会 觉得 很 熟悉 ， 但 即便 如 此 ， 你 也 一 定 可 以 学 到 新 版 PostgreSQL 中 引入 的 一 些 新 特 
性 ， 也 很 可 能 会 了 解 到 一 些 在 老 版 本 中 已 经 提供 但 此 前 被 你 遗漏 的 功能 点 。 好 吧 ， 如 果 你 
对 于 书 中 内 容 均 已 了 解 ， 那 么 本 书 对 你 来 说 依然 有 价值 ， 因 为 它 比 官方 的 PostgreSQL 手册 
要 轻 得 多 ， 最 起 码 是 便于 携带 了 。 


如 果 你 还 没 接触 过 PostgreSQL， 那 么 本 书 将 扮演 你 身边 的 PostgreSQL “布道 师 ” 的 角色 。 
这 位 “布道 师 ” 将 向 你 证 明 : 多 用 那些 很 弱 的 数据 库 一 天 ， 你 的 系统 就 不 得 不 多 做 一 天 功 
能 上 的 妥协 ， 多 绑 在 商业 数据 库 上 一 天 ， 你 就 会 被 那些 三 商 掏 走 更 多 的 钱 。 


最 后 ， 如 有 果 你 的 工作 与 数据 库 领 域 甚至 是 开 界 毫 无 关系 ， 又 或 者 你 刚刚 幼儿 园 毕 业 ， 那 
么 能 否 购买 本 书 呢 ? 答案 依然 是 “可 以 ”! 因为 封面 上 可 爱 的 象 网 鼠 图 片 就 已 经 让 本 书 物 
有 所 值 了 。 


关于 PostgreSQL 的 更 多 信息 


PostgreSQL 有 一 套 制 作 精 良 的 在 线 文档 ， 建 议 读者 收藏 它 。 这 套 文档 有 HTML 和 PDF 两 
种 格式 ， 还 有 纸 质 印 刷 版 。 


其 他 可 用 的 PostgreSQL 资源 如 下 。 


。 Planet PostgreSQL 是 PostgreSQL 技术 博客 文章 的 汇聚 站 点 ， 其 中 包含 从 PostgreSQL 核 
心 开 发 人 员 到 普通 用 户 编写 的 各 类 文章 ， 包 括 新 特性 用 法 介绍 、 原 有 特性 的 巧妙 用 法 以 
及 已 发 现 但 尚未 正式 修复 的 bug 报告 。 

。 PostgreSQL Wiki 提供 对 PostgreSQL 各 个 方面 的 使 用 技巧 说 明 ， 以 及 从 其 他 数据 库 移植 
到 PostgreSQL 的 方法 。 

。 PostgreSQL Books 提供 有 关 PostgreSQL 的 图 书 列表 信息 。 

。 PostGIS in Action Books 是 我 们 已 出 版 的 关于 PostGIS 和 pgRouting 插件 的 图 书 的 官方 站 
点 。PostGIS 是 PostgreSQL 上 的 空间 数据 管理 插件 ，pgRouting 是 基于 PostGIS 的 一 示 
网 络 路 径 规 划 插 件 ， 在 导航 出 行 类 应 用 中 经 常 要 用 到 。 


代码 与 输出 格式 
对 于 括号 中 的 内 容 ， 我 们 一 般 会 将 左 括号 与 之 前 的 内 容 放 置 于 同一 行 ， 右 括号 单独 放置 一 
行 。 这 是 经 典 的 C 语言 排版 风格 ， 我 们 比较 喜欢 ， 因 为 它 可 以 减少 空 行 数 。 格 式 如 下 : 


function ( 
Welcome to PostgreSQL 


































































































为 节省 版 面 ， 我 们 还 移 除 了 命令 行 执行 输出 结果 中 无 意义 的 空格 ， 因 此 如 果 发 现实 际 输出 
结果 的 格式 与 书 中 提供 的 不 一 致 ， 请 不 要 担心 ， 这 是 正常 的 。 


当 一 行 中 存在 多 个 把 号 时 ， 如 果 每 个 元 素 的 长 度 都 比较 短 ， 我 们 会 把 过 号 之 后 的 空格 去 
掉 。 比 如 : (Ca, 'b', 'c')。 























在 我 们 








PostgreSQL 的 SQL 解释 器 会 将 语句 中 的 制 表 符 、 换 行 符 和 回 车 符 当 作 空 白 处 理 。 


提供 的 示例 代码 中 ， 一 般 会 使 用 空白 而 不 是 制 表 符 作 为 缩 进 符 。 请 确保 使 用 的 代码 编辑 器 
不 会 自动 将 制 表 符 、 换 行 符 和 回 车 符 删除 ， 或 者 把 它们 转换 为 空格 以 外 的 字符 ， 否 则 会 导 


致 问题 。 











如 果 在 执行 示例 代码 时 遇 到 了 问题 ， 请 检查 你 复制 过 来 的 代码 与 我 们 提供 的 原始 代码 是 否 





一 致 。 








注意 ， 有 些 示 例 适用 于 Linux， 而 有 些 适用 于 Windows。 传 统 上 ， 二 者 的 路 径 分 隔 符 是 不 
同 的 ，Linux 下 是 斜 杠 (/)， 而 Windows 下 是 反 斜 杠 (\)。 但 请 注意 : 在 PostgreSQL 中 ， 
即使 是 Windows 环境 下 ， 也 一 定 要 使 用 Linux 的 / 作为 路 径 分 隔 符 ， 而 不 是 Windows 传 
统 的 \。 你 会 看 到 示例 代码 中 有 类 似 于 /postgresql_book/somefile.csv 这 样 的 路 径 ， 这 指 
的 是 Linux 服务 器 根 目录 下 的 路 径 。 如 果 使 用 的 是 Windows 环境 ， 那 么 需要 加 上 驱动 器 














符 ， 因 此 路 径 要 改 为 : C:/postgresql_book/somefile.csv。 


排版 约定 
本 书 将 使 用 如 下 排版 约定 。 


表示 新 术语 。 


。 等 宽 字 体 (constant width) 











表示 程序 片段 ， 以 及 正文 中 出 现 的 变量 、 函 数 名 、 数 据 库 、 数 据 类 型 、 环 境 变 量 、 





和 关键 字 等 。 
。 加 粗 等 宽 粗 体 (constant width bold) 

表示 应 该 由 用 户 输 入 的 命令 或 其 他 文本 。 
。 斜体 等 宽 斜 体 (constant width italic) 

表示 应 替换 成 用 户 提供 的 值 或 由 上 下 文 决 定 的 值 。 














图 标 表示 提示 或 建议 。 


NS 





该 图 标 表示 警告 或 警示 。 





使 用 代码 示例 





| 
村 


代码 和 数据 示例 可 以 从 http:/www.postgresonline.com/downloads/postgresql_book_3e.zip 下 载 。 
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本 书 是 要 帮 你 完成 工作 的 。 一 般 来 说 ， 如 果 本 书 提供 了 示例 代码 ， 你 可 以 把 它 用 在 你 的 程 
序 或 文档 中 。 除 非 你 使 用 了 很 大 一 部 分 代码 ， 否 则 无 须 联系 我 们 获得 许可 。 比 如 ， 用 本 书 
的 几 个 代码 片段 写 一 个 程序 就 无 须 获 得 许可 ， 销 售 或 分 发 O'Reilly 图 书 的 示例 光盘 则 需要 
获得 许可 ， 引 用 本 书 中 的 示例 代码 回答 问题 无 须 获 得 许可 ， 将 书 中 大 量 的 代码 放 到 你 的 产 
品 文档 中 则 需要 获得 许可 。 


我 们 很 希望 但 并 不 强制 要 求 你 在 引用 本 书 内 容 时 加 上 引用 说 明 。 引 用 说 明 一 般 包 括 书 名 、 
作者 、 出 版 社 和 JSBN。 比 如 :“PostereSOL: Up and Running, Third Edition by Regina Obe 
and Leo Hsu (O’Reilly). Copyright 2018 Regina Obe and Leo Hsu, 978-1-491-96341-8.” 


如 果 你 觉得 自己 对 示例 代码 的 用 法 超出 了 上 述 许可 的 范围 ， 欢 迎 你 通过 permissions@ 
oreilly.com 与 我 们 联系 。 


O'Reilly Safari 


4 Safari (原来 叫 Safari Books Online) 是 一 个 会 员 制 的 培训 和 参考 平 
Safari】 会 而 和 企业 政府 数 育 机 构 和 个 人 。 

会 员 可 以 访问 几 千 种 图 书 、 培 训 视频 、 学 习 路 径 、 互 动 式 教 程 和 精 选 播放 列表 ， 提 供 这 些 
资源 的 出 版 商 超过 250 家 ， 包 括 O'Reilly Media、Harvard Business Review、Prentice Hall 
Professional、Addison-Wesley Professional、 Microsoft Press、Sams、Que、Peachpit Press、 












































Adobe、Focal Press、 Cisco Press、 John Wiley & Sons、 Syngress、 Morgan Kaufmann、IBM 
Redbooks、 Packt、Adobe Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、 
Jones & Bartlett、Course Technology， 等 等 。 


要 获得 更 多 信息 ， 请 访问 http://oreilly.com/safari。 


联系 我 们 
请 把 对 本 书 的 评价 和 问题 发 给 出 版 社 。 
美国 : 


O’Reilly Media, Inc. 
1005 Gravenstein Highway North 
Sebastopol, CA 95472 


中 国 : 
北京 市 西城 区 西直门 南大 街 2 号 成 铭 大 厦 C 座 807 室 (100035) 
奥 莱 利 技术 咨询 (北京 ) 有 限 公 司 
对 于 本 书 的 评论 和 技术 性 问题 ， 请 发 送 电 子 邮件 到 : bookquestions@oreilly.com 


要 提交 勤 误 ， 请 访问 本 书 的 勘误 页 面 (https:/www.oreilly.com/catalog/errata.csp?isbn= 
0636920052715 ) 。 












































主 1: 本 书 中 文 版 勘误 请 到 http://www.ituring.com.cn/book/2460 查看 和 提交 。 一 一 编者 注 
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本 书 的 配套 网 站 地 址 是 : https://www.oreilly.com/catalog/errata.csp?isbn=0636920052715 
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PostgreSQL 是 一 款 极其 强大 的 数据 库 ， 它 的 很 多 特性 可 能 是 你 前 所 未 见 的 。 它 的 部 分 特性 
在 其 他 知名 数据 库 中 也 有 ， 但 名 称 可 能 不 同 。 在 深入 钻研 官方 手册 之 前 ， 你 需要 了 解 一 些 
核心 概念 ， 本 章 将 为 你 介绍 这 些 概念 ， 期 间 也 会 涉及 其 他 数据 库 中 的 相关 概念 和 术语 。 

本 章 将 首先 介绍 如 何 下 载 和 安装 PostgreSQL， 然 后 会 介绍 一 些 必 备 的 管理 工具 和 
PostgreSQL 术语 。 本 书写 作 之 时 ，PostgreSQL 10 已 发 布 ， 我 们 将 重点 介绍 该 版 本 的 一 些 
新 特性 。 本 章 末尾 会 提供 一 些 帮助 资源 ， 当 你 需要 额外 的 帮助 或 者 报告 bug 时 会 用 得 到 。 


1.1 为 什么 应 该 选择 PostgreSQL 


PostgreSQL 是 一 款 企业 级 关系 型 数据 库 管 理 系 统 ， 即 使 与 Oracle、Microsoft SQL Server、 
IBM DB2 等 业界 最 好 的 商用 数据 库 相 比 也 训 不 逊色 。PostgreSQL 之 所 以 如 此 特别 ， 是 因 
为 它 不 仅仅 是 一 个 数据 库 ， 还 是 一 个 功能 强大 的 应 用 开发 平台 。 


PostgreSQL 的 速度 很 快 。 大 量 的 评测 数据 已 经 表明 : 与 其 商用 以 及 开源 竞争 对 手相 比 ， 
PostgreSQL 的 速度 要 么 远 远 胜出 ， 要 么 旗 鼓 相当 。 


PostgreSQL 支持 用 多 种 编程 语言 编写 存储 过 程 和 函数 。 除 了 系统 自 带 的 C、SQL 和 PL/ 
pgSQL 编程 语言 外 ， 还 可 以 通过 安装 扩展 包 来 支持 PL/Perl、PL/Python、PL/V8 (又 称 为 
PL/JavaScript)、PL/Ruby 以 及 PL/R 等 。 这 种 支持 多 语言 的 能 力 可 以 让 开发 人 员 根 据 待 解决 
问题 的 特点 来 选择 最 合适 的 语言 。 比 如 可 以 使 用 R 语言 来 解决 统计 和 图 形 领域 的 问题 ， 通 
过 Python 来 调用 Web 服务 ， 通 过 使 用 SciPy 库 来 进行 科学 计算 ， 通过 PL/V8 来 进行 数据 
验证 、 字 符 串 处 理 和 JSON 数据 处 理 ， 等 等 。PostgreSQL 不 但 支持 种 类 繁多 的 开发 语言 ， 
使 用 过 程 也 很 简单 : 先 找到 你 需要 的 函数 ， 看 下 它 是 用 什么 语言 编写 的 ， 在 PostgreSQL 中 
安装 好 支持 该 语言 的 扩展 包 ， 然 后 把 代码 复制 过 来 就 可 以 执行 了 。 真 的 不 能 更 简单 。 
















































































大 多 数 数据 库 会 限制 用 户 只 能 使 用 预定 义 的 数据 类 型 ， 比 如 整 型 、 字 符 串 、 文 本 型 、 布 尔 
型 等 。PostgreSQL 在 数据 类 型 的 支持 方面 有 两 个 优势 : 不 但 支持 比 绝 大 多 数 数据 库 更 丰 
富 的 原生 数据 类 型 ， 而 且 还 允许 用 户 按 需 自 定 义 数 据 类 型 。 如 果 用 户 需要 更 复杂 的 数字 类 
型 ， 那么 可 以 定义 包含 两 个 浮 点 类 型 (float) 的 复合 类 型 ， 如 果 需 要 定义 一 个 三 角形 ， 那 
么 可 以 先 定义 一 种 “坐标 ”类 型 ， 然 后 再 定义 一 种 包含 三 个 坐标 的 “三 角形 ”类 型 即 可 ， 
如 果 你 对 十 二 进 制 感 兴趣 ， 那 么 可 以 定义 你 自己 的 十 二 进 制 类 型 。 值 得 注意 的 是 ， 要 想 自 
定义 类 型 完全 发 挥 出 其 威力 ， 需 要 有 相应 的 运算 符 和 函数 来 识别 并 配合 它 。 因 此 ， 如 果 你 
自 定义 了 一 种 特殊 的 数值 类 型 ， 千 万 不 要 忘 了 为 它 重 定义 配套 的 数学 运算 符 。 是 的 ， 你 没 
看 错 ，PostgreSQL 允许 用 户 重 定义 基础 运算 符 (+、-、/、*) 的 实现 逻辑 。 另 外 ， 用 户 自 
定义 一 种 数据 类 型 后 ，PostgreSQL 会 自动 定义 出 一 种 基于 该 类 型 的 数组 类 型 。 因 此 ， 如 果 
你 定义 了 一 种 复合 数据 类 型 ， 那 么 该 复合 数据 类 型 的 数组 类 型 自动 就 有 了 ， 你 无 须 做 额外 
的 定义 工作 。 

PostgreSQL 会 为 每 一 张 用 户 表 自动 创建 一 个 数据 类 型 定义 。 比 如 我 们 创建 了 一 张 名 为 dogs 
的 表 ， 包 含 breed (品种 )、cuteness (可 爱 程度 )、barkiness ( 爱 叫 的 程度 ) 等 字段 ， 那 
么 PostgreSQL 会 自动 在 后 台 创 建 一 个 同名 的 dogs 数据 类 型 。 这 一 特性 将 关系 型 数据 库 领 
域 的 “ 表 ” 概 念 与 面向 对 象 领域 的 “对 象 ” 概 念 紧密 地 联系 到 了 一 起 ， 用 户 可 以 像 处 理 
对 象 实例 一 样 去 处 理 记 录 。 比 如 你 可 以 创建 一 个 国 数 来 每 次 处 理 一 个 或 者 一 批 对 象 实例 。 
PostgreSQL 的 很 多 第 三 方 扩展 包 就 利用 该 自 定义 数据 类 型 能 力 来 优化 性 能 ， 或 者 通过 添加 
支持 某 个 领域 专用 的 特殊 SQL 语法 来 让 业务 代码 更 简洁 和 易于 维护 ， 或 者 实现 一 些 在 别 的 
数据 库 中 完全 不 可 能 实现 的 功能 。 


我 们 建议 用 户 不 要 把 数据 库 仅仅 当成 一 个 数据 容器 ， 像 PostgreSQL 这 样 的 数据 库 其 实 是 一 
个 成 熟 而 完整 的 应 用 开发 平台 。 你 会 发 现 : 强大 的 数据 库 在 手 ， 其 他 一 切 都 是 过 眼 云 烟 。 
一 旦 你 成 了 SQL 高 手 ， 别 人 用 其 他 工具 需要 几 小 时 才能 完成 的 工作 ， 你 在 数据 库 里 只 需要 
几 秒 钟 。 不 管 是 对 比 编码 时 间 还 是 对 比 实际 数据 处 理 时 间 ， 效 果 都 是 如 此 。 


近年 来 ， 我 们 看 到 很 多 NoSQL 数据 库 异 军 突起 ， 一 时 风头 无 两 (我们 认为 这 里 面 有 很 大 
的 炒作 成 分 )。 尽 管 PostgreSQL 总 体 上 看 是 一 个 关系 型 数据 库 ， 但 它 其 实 也 有 具备 强大 的 处 
里 非 关 系 型 数据 的 能 力 。 比 如 ltree 这 个 播 件 可 以 处 理 图 数据 ， 但 我 们 几乎 已 经 想 不 起 它 到 
底 是 何 时 被 加 入 到 PostgreSQL 中 的 ， 又 比如 hstore 插件 可 以 实现 键 值 存储 还 有 JSON 和 
JSONB 类 型 可 以 提供 类 似 MongoDB 的 文档 操作 能 力 。 从 很 多 方面 来 看 ，PostgreSQL 甚至 
在 “NoSQL” 这 个 词 出 现 之 前 就 已 经 提供 了 那些 所 谓 的 NoSQL 特性 。 

如 果 从 Postgres95 正式 改名 为 PostgreSQL 开始 算 起 ，PostgreSQL 已 经 诞生 二 十 年 了 ,但 
事实 上 它 的 历史 可 向 前 一 直 追 溯 到 1986 年 。'PostgreSQL 支持 当前 所 有 主流 的 操作 系统 ， 
包括 Linux、Unix、Windows 以 及 Mac。 目 前 每 年 会 发 布 一 个 大 版 本 ， 包 含 性 能 提升 以 及 
那些 不 断 超越 关系 型 数据 库 功 能 极限 的 新 功能 。 


最 后 值得 一 提 的 是 ，PostgreSQL 不 但 是 开源 的 ， 而 且 开 源 得 非常 彻底 ， 它 的 许可 策略 非 
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注 1: 从 1986 年 开始 ，Stonebraker 教授 发 表 了 一 系列 论文 ， 引入 对 象 关系 理念 ， 探 讨 了 新 的 数据 库 的 结构 
设计 和 扩展 设计 。1988 年 ， 他 发 表 了 Postgres 的 第 一 个 原型 设计 ，1989 年 6 月 发 布 了 版 本 1。 因 此 
1986 年 可 视 为 PostgreSQL 发 展 史 的 元 年 。 译 者 注 
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党 宽松。 现在 PostgreSQL 社区 由 一 群 无 私 奉献 的 的 开发 者 和 用 户 构成 ， 他 们 并 不 把 赚钱 
视 为 人 生 终 极目 标 。 如 果 需 要 新 特性 ， 你 可 以 自行 贡献 代码 或 者 提出 诉求 。 如 果 你 试图 修 
改 PostgreSQL 代码 以 为 已 所 用 ， 也 不 会 有 人 起 诉 你 。 是 成 千 上 万 用 户 的 参与 和 贡献 使 得 
PostgreSQL 变 成 了 它 今日 的 模样 。 

到 最 后 你 会 想 : 我 为 什么 还 要 使 用 别家 的 数据 库 ? PostgreSQL 已 经 提供 了 我 所 需要 的 一 
切 功能 , 而 且 还 是 免费 的 ! 你 不 再 需要 去 阅读 那些 商业 数据 库 附 带 的 密密麻麻 的 授权 条 款 ， 
来 了 解 在 一 个 八 核 虚 拟 机 上 支持 X 个 并 发 连接 所 需要 的 费用 是 多 少 ， 也 不 需要 了 解 每 次 升 
级 后 要 再 为 许可 证 加 多 少 钱 。 


1.2 不 适用 PostgreSQL 的 场景 
在 为 PostgreSQL 做 了 这 么 多 “鼓吹 ”之 后 ， 我 们 也 应 介绍 一 下 它 不 适用 于 哪些 场景 。 


在 不 安装 任何 扩展 包 的 情况 下 ，PostgreSQL 需 占 用 100MB 以 上 的 磁盘 空间 ， 可 以 看 出 它 
的 个 头 还 是 比较 大 的 。 因 此 ， 在 一 些 存储 空间 极为 有 限 的 小 型 设备 上 使 用 PostgreSQL 是 不 
合适 的 ， 把 PostgreSQL 当成 简单 的 缓存 区 来 用 也 是 不 合适 的 ， 此 时 应 选用 一 些 更 轻 量 级 的 
数据 库 。 


作为 一 款 企业 级 数据 库 产 品 ，PostgreSQL 对 于 安全 是 极其 重视 的 。 因 此 ， 如 果 你 在 开发 一 
个 把 安全 管理 放 到 应 用 层 去 做 的 轻 量 级 应 用 ， 那 么 PostgreSQL 完善 的 安全 机 制 反 倒 会 成 为 
负担 ， 因 为 它 的 角色 和 权限 管理 非常 复杂 ， 会 带 来 不 必要 的 管理 复杂 度 和 性 能 损耗 。 此 时 
可 以 考虑 选用 SQLite 这 样 的 单 用 户 数据 库 ， 或 者 选用 FireBird 这 样 既 能 以 客户 端 /服务 器 
模式 运行 也 能 以 上 府 入 式 单 用 户 模式 运行 的 数据 库 。 

通过 上 述 介 绍 可 以 看 到 ， 一 般 来 说 需要 将 PostgreSQL 与 别 的 数据 库 搭配 使 用 ， 使 它们 各 展 
所 长 。 一 种 常见 的 组 合 是 把 Redis 或 者 Memcache 当成 PostgreSQL 的 查询 缓存 来 用 ， 另 一 
种 组 合 是 用 PostgreSQL 做 主 数据 库 ， 用 SQLite 存储 离线 数据 来 做 离线 查询 。 


令 人 遗憾 的 一 个 事实 是 ， 很 多 共享 主机 服务 (多 个 用 户 共享 同一 个 操作 系统 实例 ) 供应 商 
并 不 支持 预 安装 PostgreSQL， 或 者 只 支持 安装 一 个 很 陈旧 的 版 本 。 它 们 更 喜欢 预 装 较 弱 的 
MySQL。 对 于 一 个 Web 设计 人 员 来 说 ， 用 什么 数据 库 并 不 是 首要 问题 ， 此 时 MySQL 可 
能 能 够 满足 要 求 。 但 当 用 户 的 SQL 技能 不 断 提升 ， 不 再 满足 于 写 一 写 单 表 select 或 者 简单 
的 join 查询 时 ，MySQL 的 缺点 就 会 暴露 无 遗 。 自 本 书 第 一 版 出 版 以 来 ， 虚 拟 化 技术 的 进 
步 使 得 商业 化 的 云 主机 服务 得 到 了 长 足 的 发 展 ， 因 此 拥有 自己 的 独立 云 主 机 不 再 是 一 件 很 
奢侈 的 事情 。 当 用 户 拥有 自己 的 独立 云 主机 时 ， 就 可 以 自由 选择 在 上 面 安装 什么 软件 。 随 
着 PaaS (平台 即 服务 )、DBaaS (数据 库 即 服务 ) 等 云 计算 模式 的 流行 ，PostgreSQL 的 发 
展 前 景 向 好 。 绝 大 多 数 的 云 服 务 厂 商都 提供 PostgreSQL 服务 ， 其 中 比较 著名 的 有 Heroku、 
Engine Yard、RedHat OpenShift、 Amazon RDS for PostgreSQL、 Google Cloud SQL for 
PostgreSQL、Amazon Aurora for PostgreSQL 以 及 Microsoft Azure for PostgreSQL 。 


1.3 如何 获得 PostgreSQL 


若干 年 前 ， 你 只 能 通过 手动 编译 源码 的 方式 来 安装 PostgreSQL。 还 好 那 种 痛苦 的 时 代 已 经 
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一 去 不 复 返 了 。 当 然 ， 现 在 依然 可 以 通过 编译 源码 来 安装 ， 但 大 多 数 用 户 会 使 用 制作 好 的 
安装 包 来 安装 ， 只 需 殴 击 几 下 键盘 和 鼠标 就 可 以 了 。 

如 有 果 你 是 首次 安装 PostgreSQL， 那 么 应 该 选择 适用 于 你 的 操作 系统 平台 的 最 新 稳定 版 发 行 
包 。PostgreSQL 官方 站 点 的 核心 发 布 页 面 上 维护 了 一 个 列表 ， 记 录 了 适用 于 各 操作 系统 的 
二 进 制 包 的 下 载 地 址 。 在 附录 A 中 ， 你 会 看 到 安装 指导 和 一 些 定制 版 本 的 下 载 链接 地 址 。 


1.4 管理 工具 


PostgreSQL 常用 的 管理 工具 有 四 种 : psql、pgAdmin、phpPgAdmin 和 Adminer。PostgreSQL 
的 核心 开发 团队 维护 着 前 三 种 ， 因 此 它们 一 般 会 随 着 PostgreSQL 的 版 本 发 布 而 同步 更 新 。 
Adminer 并 非 PostgreSQL 的 专用 管理 工具 ， 它 支持 管理 多 种 类 型 的 关系 型 数据 库 ， 包 括 
SQLite、MySQL、SQL Server 和 Oracle。 除 了 刚刚 提 到 的 这 四 种 以 外 ， 还 有 大 量 优秀 的 管 
里 工具 ， 开 源 的 和 商业 的 都 有 。 
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1.4.1 psql 


psql 是 一 种 用 于 执行 查询 的 命令 行 工具 ， 每 个 PostgreSQL 发 行 版 中 都 自 带 psql (参见 附 
录 B.4 节 )。 它 有 一 些 独特 的 功能 ， 比 如 导入 和 导出 基于 分 隔 符 (逗号 或 者 制 表 符 等 ) 格 
式 的 平面 数据 文件 ， 以 及 生成 简易 的 HTML 格式 报表 等 。psql 是 PostgreSQL 从 诞生 之 初 
就 一 直 附 带 的 命令 行 工具 ， 它 是 很 多 高 级 用 户 日 常 操作 工具 的 不 二 之 选 ， 非 常 适用 于 只 
控制 台 字符 界面 而 无 图 形 用 户 界面 的 使 用 场景 。 另 外 ， 在 通过 shell 脚本 执行 数据 库 操作 
时 ，psql 也 是 必 备 工具 。 不 过 新 用 户 一 般 更 喜欢 使 用 图 形 界面 工具 ， 而 且 也 无 法 理解 为 什 
么 “ 老 ” 一 代 人 会 对 命令 行 方式 那么 执着 。 















































1.4.2 pgAdmin 


pgAdmin 是 一 款 流 行 的 免费 的 PostgreSQL 图 形 界面 管理 工具 。 如 果 你 的 PostgreSQL 安装 
包 里 没有 附带 此 工具 ， 请 从 其 官网 单独 下 载 安装 。pgAdmin 可 在 PostgreSQL 支持 的 任意 
一 种 操作 系统 平台 上 运行 。 

即使 你 的 数据 库 安 装 在 只 有 控制 台 字 符 界 面 的 Linux 服务 器 上 ， 只 要 你 在 本 地 工作 站 上 安 
装 了 pgAdmin， 也 可 以 用 这 种 强大 的 图 形 化 工具 对 其 进行 管理 。 


pgAdmin 近期 已 经 发 布 了 它 的 第 四 个 大 版 本 ， 称 为 pgAdmin4。 该 版 本 对 之 前 的 pgAdmin3 
进行 了 彻底 的 重 写 ， 使 用 Python 实现 了 “一 套 代码 两 种 模式 运行 ”的 效果 ， 一 种 模式 是 作 
为 桌面 应 用 运行 ， 另 一 种 是 在 浏览 器 中 运行 。pgAdmin4 当前 的 版 本 是 1.5。pgAdmin4 的 
首 个 版 本 是 与 PostgreSQL 9.6 同时 发 布 的 ， 并 被 若干 PostgreSQL 发 行 版 作为 自 带 软件 一 起 
打包 发 布 。 如 前 所 述 ，pgAdmin4 既 可 以 作为 桌面 应 用 运行 ， 也 可 以 在 浏览 器 中 运行 。 


1-1 是 pgAdmin4 的 界面 示意 图 。 



































































































































得 Browser 


日 - 妊 local 9.6 
日 - 晴 Databases (2) 
由 [| postgres 
日 门 postgresql_book 
由 -名 Casts 
日 争 Catalogs (2) 
由 © ANSI (information_schema) 
日 © PostgreSQL Catalog (pg_catalog) 
由 -和 collations 
由 - 俞 Domains 
由 多 FTS Configurations 
由 半 FTS Dictionaries 
由 - 忆 FTs Parsers 
由 -四 FTS Templates 
由 属 Foreign Tables 
巾 - 包 》 Functions 
由 - 团 Materialized Views 
由 - 乱 Sequences 
由 [到 | Tables 
由 . 愉 Trigger Functions 
由 Types 
由 Views 
由 - 哗 Event Triggers 
日 史 Extensions (3) 
愉 hstore 
器 pg_trgm 
喉 plpgsql 
由 Li Foreign Data Wrappers 


由 Languages 


日 - 倪 schemas (3) 
由 © census 
由 -@ public 
由 -@ staging 
由 FE: Login/Group Roles 


由 -! 语 Tablespaces 
二 











0 














图 1-1: pgAdmin4 的 树 状 视图 


如 果 你 对 PostgreSQL 还 不 大 熟悉 ， 那 么 pgAdmin 毫 无 疑问 是 你 开始 PostgreSQL 学 习 之 旅 的 








最 佳 入 口 。 只 需 在 主 界面 上 摸索 一 下 ， 你 就 可 以 对 PostgreSQL 的 丰富 功能 一 


日 
采 





你 正 打算 逃离 Microsoft SQL Server 阵营 ， 并 且 习 惯 于 SQL Server 的 Management Studio， 


那么 很 快 就 能 适应 pgAdmin。 





相 比 pgAdmin3，pgAdmin4 还 有 一 些 短 板 ， 但 它 正在 快速 补 齐 并 在 很 多 方面 都 超过 了 
pgAdmin3。 即 便 如 此 ， 如 果 你 是 PgAdmin3 的 长 期 用 户 并 且 短 期 内 无 法 切换 到 pgAdmin4， 
那么 你 可 以 继续 使 用 BigSQL 公司 提供 的 pgAdmin3 LTS (长 期 支持 ) 版 ， 在 对 pgAdmin4 
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进行 完善 测试 后 再 切换 过 去 。 请 务必 牢记 ，pgAdmin4 才 是 pgAdmin 未 来 的 主力 版 本 ， 




















pgAdmin3 只 会 维持 现状 ， 不 会 再 有 什么 发 展 。 





1.4.3 phpPgAdmin 





phpPgAdmin 是 一 种 免费 的 基于 Web 页 面 的 管理 工具 ， 其 界面 如 图 1-2 所 示 。 它 是 从 流行 
的 MySQL 管理 工具 phppMyAdmin 移植 而 来 的 ， 二 者 的 差别 主要 在 于 phpPgAdmin 新 增 了 














对 PostgreSQL 的 schema、 过 程式 语言 、 类 型 转换 器 、 





























运算 符 等 对 象 的 管理 功能 。 如 果 你 





对 phpMyAdmin 很 熟悉 ， 会 发 现 phpPgAdmin 的 界面 风格 与 其 完全 类 似 。 














日 -器 example db 














包 phpPoaamin: 国 Posgresat 9.17: [ 国 example ob 
日 -全 Schemas 

© information_schema | 争 图 2 Bs > EF 有 | 
© pg_catalog Schemas” SQL ind Variables’” Processes” Lock Admin ”Privileges” Languages” Cas 
© pg toast temp 1 a @ 
日 © public 回 information_schema postgres Drop | P 

咏 Tables 一 

| [I pg_catalog postgres Drop laf | System catalog schema 

Views | 

STR | 下 回 pa_toast temp_1 postgres Drop 

忆 Functions 回 public postgres Drop | Privieges er | standard public schema 














和 Full Text Search 


命 Domains Actions on multiple lines 








Types 
作 Operators 
确 Op Classes 





LCreate schema 





Aggregates Select all / Unselect all 一 > 一 - 








1-2: phpPgAdmin 


1.4.4 Adminer 





如 果 你 正在 寻找 一 款 除 了 能 够 管理 PostgreSQL， 还 能 管理 别 的 数据 库 的 整合 型 工具 ， 那 么 
Adminer 将 是 你 合适 的 选择 。Adminer 是 一 款 轻 量 级 的 开源 PHP 应 用 程序 ， 可 以 在 同一 套 
图 形 界面 上 管理 PostgreSQL、MySQL、SQLite、SQL Server 以 及 Oracle 等 多 种 数据 库 。 
Adminer 有 一 种 独特 的 功能 让 我 们 印象 深刻 ， 它 能 够 以 图 形 化 方式 展示 数据 库 中 的 对 象 ， 
并 将 外 键 约束 关系 以 连接 线 的 方式 展示 出 来 。 另 外 ， 整 个 Adminer 程序 的 本 体 仅 包含 一 个 
PHP 文件 ， 非 常 简洁 ， 这 可 以 大 大 减少 你 安装 部 署 时 的 麻烦 。 




















图 1-3 中 ， 左 侧 是 登录 屏幕 的 截图 ， 右 侧 是 表 间 关系 








图 形 化 后 呈现 的 效果 。 很 多 用 户 会 因 








为 登录 屏幕 上 没有 填写 端口 号 的 地 方 而 感到 困惑 。 如 果 PostgreSQL 使 用 标准 的 5432 侦 听 
端口 ， 那 么 登录 时 不 填 也 没 问 题 ， 但 如 果 不 是 ， 就 需要 在 服务 器 名 称 后 面 加 上 端口 号 ， 注 

















意 用 冒号 分 隔 主机 名 和 端口 号 ， 如 图 1-3 所 示 。 














System PostgreSQL ~ lu fact types 








a fact_type_id 
Server localhost5432 category 
Username postgres fact_subcats 





short_name 
Password | eeeeeeeeeee 











facts 
Database | postgresql_book fact_type_id 
- | itract_id 
回 Permanent login i yr 
tract_id val 
tract_long_id perc 


tract_name 











1-3: Adminer 


对 于 简单 的 查询 和 修改 操作 来 说 ，Adminer 的 功能 是 足够 的 。 但 为 了 支持 多 种 数据 库 ， 
Adminer 的 功能 体系 已 经 被 裁剪 成 了 各 数据 库 均 支持 的 最 小 公共 集合 ， 因 此 你 无 法 实 
现 PostgreSQL 所 特有 的 一 些 操 作 ， 比 如 创建 新 用 户 、 授 予 权 限 、 查 询 当 前 权限 列表 等 。 
Adminer 为 了 与 它 所 支持 的 各 家 数据 库 在 概念 上 保持 兼容 和 通用 而 将 每 个 schema 当 作 一 
个 database， 这 使 得 以 图 形 化 展示 表 与 表 之 间 外 键 关 系 这 一 功能 受到 了 极 大 影响 ， 如 果 两 
个 不 同 schema 的 表 之 间 存 在 外 键 关联 关系 ， 那 么 在 Adminer 的 界面 上 是 无 法 展示 出 来 的 。 
如 果 你 是 DBA， 那 么 建议 使 用 pgAdmin， 当 然 也 可 以 安装 一 套 Adminer 以 备 不 时 之 需 。 


1.5” ”PostgreSQL 数据 库 对 和 象 


假设 你 现在 已 经 安装 好 了 PostgreSQL， 请 启动 并 连接 好 pgAdmin， 然 后 点 开 左 侧 的 目录 
树 ， 此 时 展现 在 你 面前 的 是 一 堆 令 人 眼花 练 乱 的 数据 库 对 象 ， 有 些 你 可 能 很 熟悉 ， 有 些 则 
可 能 闻所未闻 。PostgreSQL 对 象 类 型 的 数量 超过 了 绝 大 多 数 关 系 型 数据 库 (这 还 是 在 未 安 
装 任何 扩展 包 的 情况 下 )。 这 些 对 象 中 ， 有 许多 你 可 能 永远 都 不 会 用 到 ， 但 如 果 你 发 现 业 
务 上 需要 实现 一 种 新 的 对 象 类 型 ， 那 么 一 般 来 说 你 要 实现 的 东西 在 那 一 堆 眼 花 练 乱 的 对 象 
中 已 经 有 前 人 实现 过 了 ， 所 以 只 需要 正确 选用 即 可 。 本 书 不 会 介绍 PostgreSQL 以 标准 方式 
安装 完毕 后 所 提供 的 所 有 对 象 类 型 ， 因 为 PostgreSQL 引入 新 特性 的 速度 惊人 ， 任 何 一 本 书 
都 不 可 能 全 面 覆 盖 所 有 对 象 类 型 。 因 此 我 们 仅 讨 论 你 有 必要 了 解 的 那些 对 象 类 型 。 


database” 
每 个 PostgreSQL 服务 可 以 包含 多 个 独立 的 database。 


Schema 


ANSI SQL 标准 中 对 schema 有 着 明确 的 定义 ，database 的 下 一 层 逻 辑 结构 就 是 schema。 
















































































注 2: database 一 词 含义 宽泛 ， 既 可 表示 广义 的 数据 库 系 统 ， 又 可 以 表示 某 些 特定 数据 库 系 统 中 的 某 一 级 数 
据 存 储 单位 ， 如 表述 不 当 极 易 给 读者 造成 混淆 。 因 此 本 书 中 会 区 别 使 用 ， 表 示 广 义 的 数据 库 系 统 时 ， 
用 中 文 “ 数 据 库 ”;， 表示 狭 义 的 数据 存储 单位 时 ， 用 英文 “database”。 一 一 译 者 注 
注 3; 数据 库 业界 对 于 schema 有 多 种 译 法 : 纲要 、 模 式 、 方 案 ， 等 等 。 但 各 种 译 法 都 不 能 准确 直观 地 表达 

出 其 原本 的 含义 ， 即 位 于 一 个 独立 命名 空间 内 的 一 组 相关 数据 库 对 象 的 集合 ， 因 此 前 述 译 法 从 来 没有 
一 种 成 为 主流 。 一 般 业 界 人 员 都 直接 使 用 英文 schema。 考 虑 到 这 个 情况 ， 为 防止 初级 用 户 理 解困 难 ， 
我 们 也 按照 业界 习惯 直接 使 用 英文 原名 。 一 一 译 者 注 
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如 果 把 database 比 作 一 个 国家 ， 那 么 schema 就 是 一 些 独立 的 州 (或 者 是 省 、 府 、 辖 区 
等 ,具体 取决 于 各 国 的 实际 情况 )。 大 多 数 对 象 是 隶属 于 某 个 schema 的 ， 然 后 schema 
又 隶属 于 某 个 database。 在 创建 一 个 新 的 database 时 ，PostgreSQL 会 自动 为 其 创建 一 个 
名 为 public 的 schema。 如 果 未 设置 search_path 变量 (后 续 会 介绍 该 变量 的 含义 )， 那 
么 PostgreSQL 会 将 你 创建 的 所 有 对 象 默认 放 入 public schema 中 。 如 果 表 的 数量 较 少 ， 
这 是 没 问 题 的 ， 但 如 果 你 有 几 千 张 表 ， 那 么 我 们 还 是 建议 你 将 它们 分 门 别 类 放 入 不 同 的 


schema 中 。 



































任何 一 个 数据 库 中 ， 表 都 是 最 核心 的 对 象 类 型 。 在 PostgreSQL 中 ， 表 首先 属于 某 个 
schema， 而 schema 又 属于 某 个 database， 这 样 就 构成 了 一 种 三 级 存储 结构 。 

PostgreSQL 的 表 支 持 两 种 很 强大 的 功能 。 第 一 种 是 表 继 承 ， 即 一 张 表 可 以 有 父 表 和 子 
表 。 这 种 层次 化 的 结构 可 以 极 大 地 简化 数据 库 设计 ， 还 可 以 为 你 省 掉 大 量 的 重复 查询 代 
码 。 第 二 种 是 创建 一 张 表 的 同时 ， 系 统 会 自动 为 此 表 创 建 一 种 对 应 的 自 定义 数据 类 型 。 














视图 





大 多 数 关 系 型 数据 库 都 支持 视图 。 视 图 是 基于 表 的 一 种 抽象 ， 通 过 它 可 以 实现 一 次 性 
查询 多 张 表 ， 也 可 以 实现 通过 复杂 运算 来 构造 出 虚拟 字段 。 视 图 一 般 是 只 读 的 ， 但 
PostgreSQL 支持 对 视图 数据 进行 修改 ， 前 提 是 该 视图 基于 单 张 实体 表 构建 。 如 果 需 要 
修改 基于 多 张 表 关联 而 来 的 视图 ， 可 以 针对 视图 编写 触发 器 。9.3 版 还 引入 了 对 物化 视 
图 的 支持 ， 该 机 制 通过 对 视图 数据 进行 缓存 来 实现 对 常用 查询 的 加 速 ， 缺 点 是 查 到 的 数 
据 可 能 不 是 最 新 的 。 更 多 细 市 请 参见 7.1.3 市 。 
























































扩展 包 


开发 人 员 可 以 通过 该 机 制 将 一 组 相关 的 函数 、 数 据 类 型 、 数 据 类 型 转换 器 、 用 户 自 定 
义 索引 、 表 以 及 属性 变量 等 对 象 打包 成 一 个 功能 扩展 包 ， 该 扩展 包 可 以 整体 安装 和 删 
除 。 扩 展 包 在 概念 上 与 Oracle 的 package 类 似 ， 从 PostgreSQL 9.1 版 本 之 后 一 般 推荐 
使 用 该 机 制 来 为 数据 库 提 供 功能 扩展 。 扩 展 包 的 具体 安装 步 又， 请 参考 开发 手册 。 一 
般 来 说 ， 需 要 先 将 扩展 包 的 二 进 制 安装 包 和 脚本 复制 到 PostgreSQL 安装 目录 下 ， 然 后 
运行 一 系列 脚本 ， 再 在 需要 其 功能 的 database 中 单独 安装 该 扩展 包 。 注 意 ; 仅 需 在 需 
要 该 扩展 包 功 能 的 database 中 安装 ， 不 必 为 当前 数据 库 系 统 中 的 每 个 database 都 安装 。 
比如 需要 对 某 个 database 中 的 数据 进行 高 级 文本 搜索 ， 那 么 单独 在 该 database 中 安装 
fuzzystrmatch 扩展 包 即 可 。 


安装 扩展 包 时 可 以 指定 该 包 中 所 含有 的 成 员 对 象 安 装 到 哪个 shema， 若 不 指定 则 默认 
会 安装 到 public schema 中 。 我 们 不 建议 采用 默认 设置 ， 因 为 这 会 导致 public schema 
变 得 庞大 复杂 且 难 以 管理 ， 尤 其 是 如 果 你 将 自己 的 数据 库 对 象 也 都 在 入 public schema 
中 ， 那 么 情况 会 变 得 更 糟糕 。 我 们 建议 你 创建 一 个 独立 的 schema 用 于 存放 所 有 扩展 包 
的 对 象 ， 甚 至 为 规模 较 大 的 扩展 包 单独 创建 一 个 schema。 为 避免 出 现 找 不 到 新 增 扩展 
包 对 象 的 问题 ， 请 将 这 些 新 增 的 schema 名 称 加 入 search_path 变量 中 ， 这 样 就 可 以 直 
接 使 用 扩展 包 的 功能 而 无 须 关 注 它 到 底 安装 到 了 哪个 schema 中 。 也 有 一 些 扩展 包 明 确 
要 求 必 须 安装 到 某 个 schema 下 (特别 是 过 程式 语言 扩展 包 ) ， 这 种 情况 下 你 就 不 能 自行 
指定 了 。 有 很 多 语言 扩展 包 ， 比 如 plv8， 就 要 求 必须 安装 到 pg_catalog schema 中 。 
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多 个 扩展 包 之 间 可 能 存在 依赖 关系 。 在 PostgreSQL 9.6 之 前 ， 你 需要 了 解 这 个 依赖 
关系 并 把 被 依赖 包 先 装 好 ， 但 从 9.6 版 开始 ， 只 需 在 安装 时 加 上 cascade 关键 字 ， 
PostgreSQL 就 会 自动 安装 当前 扩展 包 所 依赖 的 扩展 包 。 例 如 : 


CREATE EXTENSION postgis_tiger_geocoder CASCADE; 


这 条 命令 会 先 寻 找 并 安装 被 依赖 的 postgis 和 fuzzystrmatch 这 两 个 扩展 包 ， 当 然 ， 如 
果 原 本 就 有 了 ， 就 不 需要 了 。 


用 户 可 以 编写 自 定义 函数 来 对 数据 进行 新 增 、 修 改 、 删 除 和 复杂 计算 等 操作 ， 可 以 使 用 
PostgreSQL 所 支持 的 各 种 过 程式 语言 来 编码 。PostgreSQL 装 好 以 后 自身 就 包含 了 数 以 
千 计 的 系统 函数 ， 都 在 默认 的 postgres 库 中 。 国 数 支持 返回 以 下 数据 类 型 : 标量 值 (也 
就 是 单个 值 )、 数 组 、 单 条 记录 以 及 记录 和 集 。 其 他 数据 库 将 对 数据 进行 增删 改 操作 的 函 
数 称 为 “存储 过 程 ”*”， 把 不 进行 增删 改 的 函数 叫 作 “函数 ”"， 但 PostgreSQL 中 并 不 区 分 ， 
统一 把 二 者 称 为 “函数 ”。 

内 置 编程 语言 
函数 是 以 过 程式 语言 编写 的 。PostgreSQL 默认 支持 三 种 内 置 编程 语言 ， SQL、PL/pgSQL 
以 及 C 语言。 可 以 通过 CREATE EXTENSION 或 者 CREATE PRODCEDURAL LANGUAGE 命令 来 添 
加 其 他 语言 。 目 前 较 常用 的 语言 是 PL/Python、PL/V8 ( 即 JavaScript) 以 及 PL/R。 我 们 
将 在 第 8 章 中 展示 大 量 的 相关 示例 。 

运算 符 
运算 符 本 质 上 是 以 简单 符号 形式 呈现 的 函数 别名 ， 例 如 =、&& 等 。PostgreSQL 支持 自 定 
义 运 算 符 。 如 果 用 户 定义 了 自己 的 数据 类 型 ， 那 么 一 般 来 说 需要 再 自 定义 一 些 运 算 符 来 
与 之 配合 工作 。 比 如 你 定义 了 一 个 复数 类 型 ， 那 么 你 很 有 可 能 需要 自 定 义 +、-、*、/ 
这 几 个 运算 符 来 对 复数 进行 运算 。 

外 部 表 和 外 部 数据 封装 器 
外 部 表 是 一 些 虚 拟 表 ， 通 过 它们 可 以 直接 在 本 地 数据 库 中 访问 来 自 外 部 数据 源 的 数据 。 
只 要 数据 映射 关系 配置 正确 ， 外 部 表 的 用 法 就 与 普通 表 没 有 任何 区 别 。 外 部 表 支 持 映 
射 到 以 下 类 型 的 数据 源 : CSV 文件 、 另 一 个 服务 器 上 的 PostgreSQL 表 、SQL Server 
或 Oracle 这 些 异 构 数 据 库 中 的 表 、Redis 这 样 的 NoSQL 数据 库 ， 甚 至 像 Twitter 或 
Salesforce 这 样 的 Web 服务 。 


外 部 表 映 射 关 系 的 建立 是 通过 配置 外 部 数据 封装 器 (foreign data wrapper，FDW) 实现 
的 。FDW 是 PostgreSQL 和 外 部 数据 产 之 间 的 一 架 “ 魔 法 桥 "， 可 实现 两 边 数 据 的 互联 
互通 。 其 内 部 实现 机 制 遵 循 SQL 标准 中 的 MED (Management of External Data) 规范 ， 
更 多 细节 请 参考 维基 百科 上 关于 MED 的 描述 。 

许多 无 私 的 开发 者 已 经 为 当下 大 部 分 流行 的 数据 源 开 发 了 FDW 并 已 免费 共享 出 来 。 你 
也 可 以 通过 创建 自己 的 FDW 来 练习 。( 我 们 建议 你 一 旦 成 功 了 也 公布 出 来 ， 这样 整 
个 社区 都 可 以 分 享 你 的 劳动 成 果 。) FDW 是 通过 扩展 包机 制 实现 的 ， 安 装 好 以 后 在 
pgAdmin 界面 上 名 为 Foreign Data Wrapper 的 目录 节点 下 能 看 到 它 。 
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触发 器 和 触发 器 函数 


绝 大 多 数 企业 级 数据 库 都 支持 触发 器 机 制 ， 该 机 制 可 以 侦 测 到 数据 修改 事件 的 发 生 。 在 
PostgreSQL 中 ， 当 一 个 触发 器 被 触发 后 ， 系 统 会 自动 调用 用 户 定义 好 的 触发 器 函数 。 
触发 器 的 触发 时 机 是 可 设置 的 ， 可 以 是 语句 级 触发 或 者 记录 级 触发 ， 也 可 以 是 修改 前 触 
发 或 修改 后 触发 。 
在 pgAdmin 中 ， 如 果 希 望 了 解 哪些 表 上 挂 载 了 触发 器 ， 只 需 在 对 象 树 上 层 层 点 击 ， 一 直 
打开 到 表 这 一 级 ， 然 后 可 以 看 到 下 面 有 个 trigger 子 栏 目 ， 里 面 就 是 该 表 的 所 有 触发 器 。 
定义 触发 器 时 需要 定义 对 应 的 触发 器 函数 ， 这 类 函数 与 前 面 介绍 过 的 普通 函数 有 所 不 
同 ， 主 要 差异 在 于 触发 器 函数 可 以 通过 系统 内 置 变量 来 同时 访问 到 修改 前 和 修改 后 的 数 
据 ， 这 样 就 可 以 实现 对 于 非法 的 数据 修改 行为 的 识别 和 拦截 。 因 此 触发 器 函数 一 般 会 用 
于 编写 复杂 校 验 逻辑 ， 这 类 复杂 人 逻辑 通过 check 约束 是 无 法 实现 的 。 
PostgreSQL 的 触发 器 技术 正在 快速 的 演进 之 中 。9.0 版 引入 了 对 WITH 子 句 的 支持 ， 通 过 
它 可 以 实现 带 条 件 的 记录 级 触发 ， 即 只 有 当 某 条 记录 符合 指定 的 WHEN 条 件 时 ， 触 发 器 
会 被 调用 。9.0 版 还 引入 了 UPDATE OF 子 句 ， 通 过 它 可 以 实现 精确 到 字段 级 的 触发 条 
件 设置 。 仅 当 指定 的 字段 内 容 被 更 改 时 才 会 激活 触发 器 。9.1 版 支持 了 针对 视图 的 触发 
器 。9.3 版 支持 了 针对 DDL 的 触发 器 。 目 前 支持 触发 器 的 DDL 命令 列表 请 参见 官方 手 
册 中 “触发 器 触发 时 机 一 览 表 ”。pgAdmin 中 会 把 DDL 触发 器 列 在 event trigger 这 一 栏 
下 。 最 后 值得 一 提 的 是 ， 从 9.4 版 开始 ， 针 对 外 部 表 的 触发 器 也 获得 了 支持 。 












































catalog 





catalog 是 系统 级 的 schema， 用 于 存储 系统 函数 和 系统 元 数据 。 每 个 database 创建 好 
以 后 默认 都 会 含有 两 个 catalog: 一 个 名 为 pg_catalog， 用 于 存储 PostgreSQL 系统 自 
带 的 函数 、 表 、 系 统 视图 、 数 据 类 型 转换 器 以 及 数据 类 型 定义 等 元 数据 ， 另 一 个 是 
information_schema， 用 于 存储 ANSI 标准 中 所 要 求 提 供 的 元 数据 查询 视图 ， 这 些 视 医 
遵从 ANSI SQL 标准 的 要 求 ， 以 指定 的 格式 向 外 界 提供 PostgreSQL 元 数据 信息 。 


一 直 以 来 ，PostgreSQL 数据 库 的 发 展 都 严格 地 遵循 着 其 “自由 与 开放 ”的 核心 理念 。 
如 果 你 足够 了 解 这 款 数据 库 ， 会 发 现 它 几乎 是 一 种 可 以 “自我 生长 ”的 数据 库 。 比 如 ， 
它 所 有 的 核心 设置 都 保存 在 系统 表 中 ， 用 户 可 以 不 受 限 地 查看 和 修改 这 些 数 据 ， 这 为 
PostgreSQL 提供 了 远 超 任何 一 种 商业 数据 库 的 巨大 灵活 性 〈 不 过 从 另 一 个 角度 看 ， 将 
这 种 灵活 性 称 为 “可 破坏 性 ”也 未 尝 不 可 )。 只 要 仔细 地 研究 一 下 pg_catalog， 你 就 可 
以 了 解 到 PostgreSQL 这 样 一 个 庞大 的 系统 是 如 何 基于 各 种 部 件 构建 起 来 的 。 如 果 你 有 
超级 用 户 权 限 ， 那 么 可 以 直接 修改 pg_catalog 的 内 容 (当然 ， 如 果 改 得 不 对 ， 那 你 的 
行为 就 跟 搞 破坏 没什么 两 样 了 )。 

Information_schema catalog 在 MySQL 和 SQL Server 中 也 有 。PostgreSQL 的 Information_ 
schema 中 最 和 常用 的 视图 一 般 有 以 下 几 个 : columns 视图 ， 列 出 了 数据 库 中 的 所 有 字段 ， 
tables 视图 ， 列 出 了 数据 库 中 的 所 有 表 (包括 视图 ) ，views 视图 ， 列 出 了 所 有 视图 以 
及 用 于 创建 该 视图 的 原始 SQL。 











































































































注 4: catalog 的 译 法 与 schema 存在 相同 的 问题 ， 翻 译 为 “目录 ”后 并 不 能 让 读者 准确 地 理解 其 原意 ， 反 而 




















容易 造成 混淆 ， 因 此 还 是 沿用 英文 原名 。 一 一 译 者 注 
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类 型 
类 型 是 数据 类 型 的 简称 。 每 种 数据 库 产品 和 每 种 编程 语言 都 会 支持 一 系列 的 数据 类 型 ， 
比如 整 型 、 字 符 型 、 数 组 、 二 进 制 大 对 象 (blob) 等 。 除 前 述 常见 类 型 外 ，PostgreSQL 
还 支持 复合 数据 类 型 ， 这 种 类 型 可 以 是 多 种 数据 类 型 的 一 个 组 合 ， 比 如 复数 、 极 坐标 、 
向 量 、 张 量 等 都 是 复合 数据 类 型 。 
PostgreSQL 会 自动 为 用 户 自己 创建 的 表 定 义 一 个 同名 的 复合 数据 类 型 。 这 样 就 可 以 把 
表 记 录 当 作对 象 实例 来 处 理 。 当 用 户 需要 在 函数 中 遍历 表 记 录 时 ， 该 特性 特别 有 用 。 注 
意 : 在 pgAdmin 的 界面 上 你 看 不 到 这 些 在 创建 表 时 自动 生成 的 自 定义 类 型 ， 但 请 放心 ， 
这 并 不 代表 它们 不 存在 。 
全 文 检索 
全 文 检索 (full text search，FTS) 是 一 种 基于 自然 语言 的 搜索 机 制 。 这 种 搜索 机 制 有 一 
些 “ 智 能 ”成 分 。 与 正则 表达 式 搜索 不 同 ， 全 文 检 索 能 够 基于 语义 来 进行 匹配 查找 ， 而 
不 仅仅 是 纯粹 的 语法 匹配 。 例 如 ， 用 户 需要 在 一 段 长 文本 中 搜索 running 这 个 词 ， 那 么 
命中 的 结果 可 能 包含 rn、running、jog、sprint、dash 等 词 。 全 文 检索 功能 依赖 于 FTS 
配置 库 、FTS 词典 、FTS 解析 器 这 三 个 部 件 。 有 了 它们 ，PostgreSQL 原生 的 FTS 功能 
即 可 正常 使 用 。 一 般 场景 下 的 全 文 检索 靠 这 三 个 原生 部 件 已 经 足够 ,但 在 涉及 药理 学 、 
有 组 织 犯 罪 学 等 专业 场景 下 ， 搜 索 目 标 文 本 中 会 包括 该 领域 专 有 词汇 和 特殊 语法 规则 ， 
此 时 需要 用 专门 的 FTS 部 件 来 替换 原生 FTS 部 件 。 我 们 会 在 5.8 节 探 讨 FTS 功能 。 
数据 类 型 转换 器 
数据 类 型 转换 器 可 以 将 一 种 数据 类 型 转换 为 男 一 种 ， 其 底层 通过 调用 转换 函数 来 实现 真 
正 的 转换 逻辑 。PostgreSQL 支持 用 户 自 定义 转换 器 或 者 重 载 、 加 强 默认 的 转换 器 。 例 
如 ， 如 果 你 需要 把 邮政 编码 (美国 的 邮政 编码 是 一 个 5 位 的 整数 ) 从 integer 转换 为 
character， 那 么 可 以 自 定义 一 个 支持 “数字 不 足 5 位 则 前 面 自动 补 0” 规 则 的 转换 器 。 


转换 器 可 以 被 隐 式 调用 也 可 以 被 显 式 调用 。 隐 式 转 换 是 系统 自动 执行 的 ， 一 般 来 说 ， 将 
一 种 特定 数据 类 型 转 为 更 通用 的 数据 类 型 (比如 数字 转换 为 字符 串 ) 时 就 会 发 生 隐 式 类 
型 转换 。 如 果 进 行 隐 式 转换 时 系统 找 不 到 合适 的 转换 器 ， 你 就 必须 显 式 执行 转换 动作 。 


序列 号 生成 器 
序列 号 生成 器 用 于 实现 serial 数据 类 型 值 的 自动 递增 分 配 。 在 创建 serial 字段 时 ， 
PostgreSQL 会 自动 为 其 创建 一 个 相应 的 序列 号 生成 器 ， 但 用 户 也 可 以 很 方便 地 更 改 其 
初始 值 、 步 长 和 下 一 个 值 。 因 为 序列 号 生成 器 是 独立 对 象 ， 所 以 多 个 表 可 以 共享 同一 个 
序列 号 生成 器 。 基 于 该 机 制 ， 用 户 可 以 实现 跨越 多 个 表 的 唯一 键 。SQL Server 和 Oracle 
也 都 支持 序列 号 生成 器 ， 但 必须 手动 创建 。 

规则 
规则 的 功能 是 在 一 个 SQL 执行 前 对 其 进行 改写 。 本 书 中 不 会 讨论 有 关 规则 的 内 容 ， 
为 这 一 技术 已 经 过 时 ， 通 过 触发 器 能 实现 相同 的 功能 。 

PostgreSQL 允许 用 户 对 前 述 每 一 种 对 象 进行 参 数 配 置 。 这 些 参 数 可 以 在 服务 级 、 库 级 、 函 

数 级 等 不 同 层 级 生效 。 你 将 来 很 可 能 会 看 到 一 个 很 炫 的 词 叫 GUC， 意 思 是 “大 一 统 配置 ” 

(grand unified configuration) ， 它 实际 上 指 的 就 是 PostgreSQL 中 的 那些 配置 参数 。 
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1.6 最 新 版 本 的 PostgreSQL 中 引入 的 新 特性 


PostgreSQL 在 每 年 的 9 月 份 会 发 布 一 个 大 版 本 。 每 个 新 版 本 都 会 带 来 稳定 性 、 安 全 性 、 性 
能 等 方面 的 提升 ， 以 及 一 些 前 沿 的 新 特性 。 而 且 版 本 升级 过 程 也 变 得 越 来 越 简单 。 那 么 显 
而 易 见 ， 请 尽量 把 你 的 数据 库 及 时 升级 到 最 新 的 稳定 版 。 关 于 每 个 版 本 引入 的 关键 特性 列 
表 ， 请 参见 官方 提供 的 “PostgreSQL 各 版 本 功能 特性 一 览 表 ”。 


1.6.1 为 什么 要 升级 


如 果 你 正在 使 用 PostgreSQL 9.1 或 者 更 早 的 版 本 ， 请 立即 升级 ! 因为 9.1 版 在 2016 年 9 月 
已 进入 生命 周期 终结 (end of life，EOL) 状态 。 请 参考 PostgreSQL 官方 的 发 行 版 支持 策 
略 以 获取 更 多 关于 PostgreSQL EOL 政策 的 细节 。 请 务必 不 要 使 用 已 过 了 EOL 期 限 的 版 
本 ， 因 为 开发 组 不 会 再 为 其 提供 新 的 安全 更 新 和 功能 补丁 。 一 旦 这 种 老 版 本 出 了 问题 ， 你 
只 能 花 钱 去 请 PostgreSQL 专家 级 顾问 来 解决 故障 或 寻找 临时 解决 方案 ， 这 种 服务 一 般 都 是 
很 昂贵 的 ， 而 且 你 不 一 定 能 找 得 到 这 种 专家 。 


不 管 当前 使 用 的 是 哪个 大 版 本 ， 你 都 应 该 尽快 跟 进 小 版 本 号 的 更 新 。 比 如 从 9.1.17 升级 到 
9.1.21， 只 需要 替换 二 进 制 文件 并 重启 一 下 即 可 。 小 版 本 仅 修改 pug 而 不 会 涉及 功能 变化 ， 
因此 这 种 升级 是 很 安全 的 ， 也 会 为 你 降低 出 问题 的 概率 。 


1.6.2 ”PostgreSQL 10 中 引入 的 新 特性 


PostgreSQL 10 是 目前 最 新 的 稳定 版 于 2017 年 10 月 发 布 。 从 PostgreSQL 10 开始， 
PostgreSQL 会 以 一 种 新 的 方式 升级 其 版 本 号 。 在 之 前 的 版 本 中 ， 发 布 大 版 本 时 变化 的 是 第 
二 位 小 版 本 号 ， 比 如 从 PostgreSQL 9.5 到 PostgreSQL 9.6， 即 使 增加 了 一 [大 1 
能 ， 也 只 有 小 版 本 号 发 生变 化 。 但 从 PostgreSQL 10 开始 ， 每 个 变化 较 大 的 版 本 都 会 在 主 
版 本 号 上 加 一 。 因 此 PostgreSQL 10 的 下 一 个 大 版 本 是 PostgreSQL 11。 这 样 就 与 SQLite、 
SQL Server、Oracle 等 数据 库 的 版 本 号 策略 保持 了 一 致 。 


以 下 是 PostgreSQL 10 中 引入 的 关键 新 特性 。 


提升 了 查询 的 并 行 度 
对 于 并 行 查询 启用 了 新 的 优化 策略 ， 包 括 并 行 位 图 堆 扫 描 、 并 行 素 引 扫描 等 。 这 些 增 强 
将 使 得 更 多 查询 语句 能 被 并 行 执行 。 请 参考 9.4 节 以 了 解 更 多 信息 

逻辑 复制 

此 前 版 本 的 PostgreSQL 中 已 经 支持 流 复制 特性 。 通 过 流 复制 可 以 实现 整个 PostgreSQL 
服务 实例 的 复制 ， 但 该 机 制 有 一 些 男 ee 点 : 从 节点 是 只 读 的 ， 只 能 用 于 数据 查询 ， 
不 能 对 其 数据 进行 修改 ， 从 节点 上 也 不 能 创建 自己 独 有 的 表 。 人 逻辑 复制 解决 了 这 两 个 问 
题 。 通 过 逻辑 复制 可 以 实现 仅 复制 单 张 表 或 者 单个 database (不 用 复制 整个 服务 实例 的 
所 有 数据 )。 既 然 不 需要 复制 整个 数据 库 服务 ， 那 么 自然 从 库 上 就 可 以 有 自己 的 表 和 数 
据 ， 这 部 分 数据 是 不 包含 在 复制 体系 中 的 ， 因 此 主 从 库 上 允许 不 一 样 。 


针对 JSON 和 JSONB 类 型 的 全 文 检索 
此 前 的 版 本 中 ，to_tsvector 函数 仅 能 为 文本 类 型 的 字段 生成 全 文 检索 向 量 。 现 在 它 已 
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支持 处 理 JSON 和 JSONB 类 型 ， 处 理 过 程 中 会 忽略 其 中 key 的 部 分 ， 而 仅 包含 value 的 
部 分 。 同 时 ts_headline 函数 也 专 为 JSON 和 JSONB 类 型 做 了 适 配 ， 它 可 以 对 JSON 内 
容 中 的 关键 字 进 行 加 亮 标 记 。 详 情 请 参考 5.8.7 市 。 


支持 ANSI 标准 中 的 XMLTABLE 特性 
XMLTABLE 特性 可 以 将 XML 文本 内 容 以 一 种 更 为 简单 的 方式 映射 为 普通 二 维 表 记 录 。 该 
特性 在 Oracle 和 IBM DB2 中 已 支持 。 详 情 请 参见 示例 5-41。 


FDW 聚合 下 推 
FDW API 可 以 将 COUNT(*) 或 者 SUM(*) 这 种 聚合 操作 推送 到 远 端 市 点 执行 。postgres_ 
fdw 插件 从 该 特性 中 受益 最 大 。 此 前 的 版 本 中 ，postgres_fdw 插件 在 执行 聚合 操作 时 ， 
需要 把 所 有 相关 数据 从 远 端 PostgreSQL 取 到 本 地 然后 再 进行 聚合 运算 ， 这 极 大 地 影响 
了 整体 运算 效率 。 

声明 式 表 分 区 
此 前 的 版 本 中 ， 实 现 分 区 表 功 能 需要 借助 表 继 承 机制 。 表 继承 机 制 的 问题 在 于 ， 用 户 需 
要 自行 编写 触发 器 来 实现 把 数据 分 流 到 子 表 中 的 过 程 。PostgreSQL 10 引入 了 PARTITION 
BY 语法 ， 利 用 该 语法 ， 用 户 只 需 在 创建 表 时 附加 PARTITION BY 子 句 就 可 以 自动 实现 表 
分 区 。 此 后 向 父 表 插入 数据 时 ， 数 据 会 被 分 流 到 子 表 中 ， 这 一 切 都 是 自动 的 ， 无 须 用 户 
预先 创建 触发 器 。 请 参考 6.1.3 节 以 了 解 详情 。 

查询 性 能 优化 
该 版 本 中 对 查询 性 能 实现 了 多 方面 的 优化 。 

支持 创建 多 字段 统计 信息 
CREATE STATISTICS 命令 支持 针对 多 个 字段 建立 统计 信息 。 具 体 请 参见 示例 9-18。 


支持 IDENTITY 数据 类 型 
新 增 支 持 IDENTITY 自 增 字段 类 型 ， 创 建 表 和 修改 表 结 构 时 都 可 以 使 用 。 增 加 该 类 型 是 
为 了 在 设计 表 的 自 增 字 段 时 更 加 符合 业界 通行 做 法 。 有 具体 请 参见 示例 6-2。 


1.6.3 PostgreSQL 9.6 中 引入 的 新 特性 
PostgreSQL 9.6 发 布 于 2016 年 9 月， 是 9.x 系列 中 的 最 新 版 本 。 


支持 并 行 查询 
9.6 版 之 前 ，PostgreSQL 并 不 能 充分 地 利用 系统 中 的 多 核能 力 。9.6 版 中 ，PostgreSQL 
引擎 能 够 将 一 些 特定 类 型 的 查询 语句 放 到 多 个 处 理 器 核心 上 并 行 执行 。 支 持 并 行 执行 的 
操作 有 : 顺序 扫描 、 部 分 join 以 及 部 分 聚合 操作 。 然 而 ， 增 删改 这 些 修改 数据 的 操作 无 
法 实现 并 行 。 支 持 并 行 化 的 工作 还 在 进行 中 ， 最 终 目标 是 所 有 的 语句 都 能 利用 到 多 核 并 
行 执行 。 详 情 参见 9.4 市 。 

支持 关联 词组 全 文 检 索 
全 文 检索 支持 关联 词组 搜索 ， 可 以 使 用 <-> 运算 符 来 表示 两 个 关联 词 之 间 的 距离 。 即 使 
关联 词 没有 连 在 一 起 出 现 ， 只 要 二 者 出 现 的 位 置 不 超出 前 述 距 离 ， 也 认为 该 关联 词组 搜 
索 命 中 。 在 9.6 之 前 的 版 本 中 ， 只 能 搜索 一 些 单个 的 词 ， 但 该 功能 使 得 用 户 可 以 搜索 一 
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组 有 前 后 顺序 的 词组 。 详 情 请 参见 5.8 市 。 


psql 工具 支持 \gexec 参数 
该 参数 的 功能 是 读 取 并 执行 一 个 根据 查询 语句 动态 生成 的 SQL。 详情 请 参见 3.4.5 节 。 
postgres_fdw 增强 
对 于 简单 的 更 新 、 插 入 和 删除 来 说 ， 速 度 有 很 大 提升 。 请 参考 博文 “Directy Modify 
Foreign Tables” 以 了 解 详 情 。 


FDW 关联 操作 下 推 
包括 postgres_fdw 在 内 的 部 分 FDW 已 支持 该 特性 。 当 需要 对 多 张 外 表 做 关联 查询 时 ， 之 
前 的 做 法 是 把 每 张 外 表 的 数据 取 回 本 地 然后 做 关联 计算 ， 支 持 了 该 特性 的 FDW 的 优化 处 
理 方 式 是 : 如 果 需 要 关联 的 两 张 外 表 都 来 自 于 同一 台 外 部 服务 器 ， 那 么 就 把 join 操作 下 
推 到 这 个 外 部 服务 器 上 去 执行 ， 然 后 仅 把 关联 结果 拿 回 来 。 这 样 可 以 极 大 地 减少 经 网 络 
传输 的 记录 数 。 当 关联 操作 可 以 过 滤 掉 大 量 数据 时 ， 这 个 特性 带 来 的 性 能 提升 是 巨大 的 。 


1.6.4 ”PostgreSQL 9.5 中 引入 的 新 特性 

PostgreSQL 9.5 发 布 于 2016 年 1 月 ， 其 主要 的 新 特性 如 下 。 

外 部 表 架 构 的 改进 
支持 了 新 的 IMPORT FOREIGN SCHEMA 命令 ， 通 过 该 命令 可 以 从 外 部 服务 器 中 加 载 表 结构 
信息 从 而 实现 批量 创建 外 表 。 支 持 外 表 继 承 : 本 地 表 可 以 继承 自 外 表 ， 外 表 也 可 以 继承 
自 本 地 表 ， 外 表 也 可 以 继承 自 另 一 张 外 表 。 支 持 在 外 表 上 创建 约束 。 详 情 请 参见 10.3 
节 和 10.3.3 节 。 


支持 无 日 志 表 直接 升级 为 日 志 表 
由 于 无 日 志 表 不 写 日 志 ， 往 其 中 导入 数据 时 会 很 快 ， 但 缺点 是 数据 库 骨 误 时 会 完全 丢失 
数据 。 在 此 前 的 版 本 中 ， 当 数据 完全 导入 无 日 志 表 后 ， 要 想 把 无 日 志 表 改 为 日 志 表 需要 
创建 一 张 新 表 ， 然 后 再 把 无 日 志 表 的 数据 写 入 新 表 。9.5 版 提供 了 一 个 新 的 语法 : ALTER 
TABLE ... SET UNLOGGED， 可 以 直接 把 无 日 志 表 修改 为 日 志 表 ， 这 样 就 省 去 了 重新 建 表 并 
搬迁 数据 的 过 程 。 

array_agg 函数 支持 数组 入 参 
array_agg 国 数 可 以 将 某 字 段 的 多 条 记录 聚合 为 一 个 数组 。 在 9.5 版 之 前 ， 入 参 字段 类 
型 不 能 是 一 个 数组 ， 但 9.5 版 之 后 支持 输入 数组 入 参 ， 这 样 就 可 以 构造 出 多 维 数组 。 详 
情 请 参见 示例 5-17。 

支持 BRIN 索引 类 型 
BRIN (block range index) 是 一 种 新 型 的 索引 ， 相 比 B- 树 和 GIN 索引 有 着 更 小 的 内 存 
占用 。 有 些 情况 下 BRIN 索引 会 比 前 述 两 种 索引 速度 更 快 。 详 情 请 参见 6.3 市 。 

支持 GROUPING SETS、ROLLUP 和 CUBE 聚合 语法 
该 特性 用 于 聚合 查询 语句 中 ， 可 以 实现 一 次 性 获取 多 维度 汇聚 结果 。 具 体例 子 请 参见 
ga 





















































仅 索引 扫描 
如 有 果 要 查询 的 字段 在 索引 中 已 经 全 部 包含 ， 则 仅 扫 描 索 引 即 可 获得 查询 结果 ， 而 不 用 访 
问 表 数据 ， 这 种 查询 模式 称 为 “ 仅 索引 扫描 ”。 当 前 只 有 GiST 索引 支持 此 特性 。 


支持 “无 则 插入 有 则 更 新 ”处 理 〈 即 UPSERT 能 力 ) 
9.5 版 之 前 ， 如 果 插 入 或 者 更 新 操作 韦 反 了 主键 约束 或 者 其 他 约束 ， 那 么 该 操作 会 失败 。 
9.5 版 提供 了 一 种 机 制 ， 允 许 用 户 捕 获 该 异常 并 自 定义 末代 操作 或 者 跳 过 引发 问题 的 记 
录 。 详 情 请 参见 7.2.11 市 。 

支持 跳 过 无 法 写 锁定 的 记录 
如 果 用 户 希 望 锁定 一 些 记 录 以 用 于 后 续 更 新 ， 那 么 可 以 使 用 SELECT ... FOR UPDATE 来 
锁定 这 些 记 录 。 在 9.5 版 之 前 ， 如 果 试 图 锁定 的 部 分 或 者 全 部 记录 已 被 其 他 用 户 锁定 ， 
那么 当前 用 户 的 锁定 操作 就 会 报错 。9.5 版 中 提供 了 一 个 SKIP LOCKED 子 旬 语法 ， 可 以 
跳 过 那些 已 经 被 别人 锁定 的 记录 ， 这 样 就 不 会 报错 。 


行 级 安全 控制 
支持 对 用 户 设置 记录 级 的 读 写 权 限 ， 即 同一 张 表 中 ， 部 分 记录 只 允许 某 个 用 户 读 写 ， 另 
外 一 部 分 记录 只 人 允许 另外 一 个 用 户 读 写 。 在 多 租户 场景 下 ， 显 然 该 功能 是 特别 有 用 的 ， 
对 于 需要 进行 访问 权限 隔离 而 又 无 法 通过 分 表 实 现 的 场景 ， 该 功能 也 特别 有 价值 。 


1.6.5 PostgreSQL 9.4 中 引入 的 新 特性 
9.4 版 发 布 于 2014 年 9 月 ， 主 要 包含 以 下 新 特性 。 


物化 视图 特性 的 改进 

在 9.3 版 中 ， 刷 新 物化 视图 期 间 会 对 其 加 锁 并 禁止 访问 ， 而 加 锁 时 间 可 能 会 比较 长 ， 这 
直接 导致 在 生产 环境 中 物化 视图 的 实用 价值 严重 受 限 。9.4 版 中 取消 了 刷新 时 的 加 锁 动 
乍 ， 因 此 即使 是 正在 被 刷新 的 物化 视图 也 可 被 访问 。 但 请 注意 : 利用 此 特性 的 前 提 是 物 
化 视图 必须 拥有 一 个 唯一 索引 。 


新 增 支持 用 于 计算 百分比 的 分 析 函 数 
新 增 了 对 percentile_disc (不 连续 百分比 ) 和 percentile_cont (连续 百分比 ) 这 两 
个 分 析 国 数 的 支持 ， 须 配合 WITHIN GROUP (ORDER BY...) 子 句 使 用 。PostgreSQL 专家 
Hubert Lubaczewski 在 文章 “Ordered Set Within Group Aggregates” 中 介绍 了 ORDERED 
SET WITHIN GROUP 聚合 运算 。 在 9.5 之 前 的 版 本 中 ，PostgreSQL 并 未 提供 过 计算 中 位 数 
的 函数 。 这 是 有 原因 的 。 如 果 你 对 计算 中 位 数 的 相关 算法 有 所 了 解 的 话 ， 应 该 知道 这 种 
算法 中 最 后 都 会 有 一 个 额外 的 类 似 于 “平局 加 时 赛 ”的 计算 步骤 ， 这 个 步骤 的 存在 使 得 
将 中 位 数 算法 实现 为 聚合 函数 非常 困难 。9.5 版 中 引入 的 这 两 个 分 析 函 数 使 用 了 一 种 快 
速 中 位 数 估算 算法 ， 从 而 绕 开 了 前 述 问题 。 我 们 将 在 7.2.16 节 对 这 两 个 函数 进行 更 深入 
的 介绍 。 

支持 对 视图 更 新 操作 的 结果 范围 进行 限制 
创建 视图 时 支持 WITH CHECK OPTION 子 句 ， 其 作用 是 确保 在 视图 上 执行 更 新 或 者 插入 操 
作 时 ， 修 改 后 或 者 新 播 入 的 记录 仍然 在 本 视图 可 见 范 围 内 。 详 情 请 参见 示例 7-3。 
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新 增 对 JSONB 数据 类 型 的 支持 
该 数据 类 型 是 JSON (JavaScript Object Notation) 类 型 的 二 进 制 存储 版 本 。 通 过 JSONB 
类 型 可 以 对 JSON 格式 的 文档 数据 建立 索引 ， 并 可 加 快 对 其 内 部 元 素 的 访问 速度 。 详 细 
信息 请 参考 5.6 节 ， 同 时 可 参考 这 两 篇 博客 文章 :“Introduce jsonb: A Structured Format 
for Storing JSON” 以 及 “JSONB: Wildcard Query”。 


GIN 索引 改进 
GIN 索引 在 设计 时 已 经 考虑 了 要 适用 于 全 文 搜索 、 三 连词 处 理 、hstore 键 值 数据 库 以 
及 jsonb 类 型 支持 等 场景 。 在 很 多 情况 下 你 其 至 可 以 把 它 当 作 B- 树 索引 的 替代 品 ， 一 
般 来 说 GIN 索引 与 B- 树 的 查找 效率 相当 ,但 占用 空间 更 少 。9.5 版 中 ，GIN 索引 的 查 
询 速度 被 进一步 提升 。 详 情 请 参见 “GIN as a Substitute for Bitmap Indexes” 这 篇 文章 的 
介绍 。 


支持 更 多 JSON 函数 
具体 包括 jsonbutLd array、json_build object、json_object、json_to_record 和 
json_to_recordset 等 几 个 函数 。 


加 速 跨 表 空间 的 对 象 搬迁 
支持 使 用 以 下 语法 轻松 地 将 所 有 数据 库 对 象 从 一 个 表 空 间 移动 到 另 一 个 表 空 间 : ALTER 


TABLESPACE old_space MOVE ALL TO new_space;, 


支持 对 返回 的 结果 集中 的 记录 加 上 数字 编号 
现在 可 以 为 查询 结果 中 的 记录 添加 行 号 。 行 号 用 系统 字段 ordinality (该 字段 是 在 
ANSI SQL 标准 中 定义 的 ) 表示 。 当 需要 将 存储 为 数组 、hstore 键 值 对 或 者 复合 类 型 的 
非 格式 化 数据 转换 为 格式 化 记录 时 ， 该 功能 特别 有 用 。 以 下 是 一 个 使 用 hstore 的 例子 : 


SELECT ordinality, key, value 
FROM each('breed=>pug,cuteness=>high'::hstore) NITH ordinality; 


支持 通过 执行 SQL 命令 来 更 改 系 统 配置 设置 
利用 ALTER system SET ... 语法 ， 无 须 修改 postgresql.conf 文件 即 可 设置 全 局 系统 配置 。 
postgresql.conf 文件 具体 的 修改 方法 请 参见 2.1.2 节 。 这 也 意味 着 用 户 可 以 通过 编程 的 方式 
动态 地 调整 系统 配置 项 ， 但 请 注意 : 有 的 配置 项 修改 后 需要 重启 数据 库 才能 生效 。 





















































触发 器 功能 增强 
9.4 版 中 支持 了 对 外 部 表 创 建 触发 器 。 
数据 行 转 列 能 力 增强 


unnest 函数 用 于 实现 数据 的 行 转 列 操作 ， 即 将 一 个 横向 的 数组 转换 为 纵向 的 一 个 字段 
的 多 行 记 录 。 该 函数 可 接受 多 个 数组 作为 和 人参 ,每 个 数组 转换 后 成 为 单独 的 一 列 ， 即 输 
入 几 个 数组 转换 后 就 有 几 列 。 如 果 每 个 数组 的 元 素 个 数 不 一 样 ，9.4 版 之 前 转换 后 的 结 
果 是 不 可 预知 的 ，9.4 版 本 后 这 种 情况 下 转换 的 结果 是 可 预知 的 ， 会 以 最 长 的 数组 为 标 
准 ， 其 他 不 足 此 长 度 的 数组 元 素 补 null。 

新 增 ROWS FROM 语法 
该 语法 可 以 将 多 个 函数 返回 的 结果 集 逐 行 拼 接 起 来 ， 最 后 作为 一 个 完整 的 结果 集 返 回 ， 
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因此 即使 这 些 结果 集 之 间 的 元 素 个 数 不 一 致 也 没关系 ， 如 下 例 所 示 : 


SELECT * 

FROM ROWS FROM (jsonb_each('{"a":"foo1","b":"bar"}'::jsonb), 
jsonb_each('{"c":"foo2"}'::jsonb)) 
x (al,al_val,a2_val); 





支持 动态 启用 后 台 工 作 线 程 


当 使 用 SQL 或 PostgreSQL 函数 都 无 法 实现 所 需要 的 功能 时 ， 可 以 使 用 C 语言 编码 实现 
动态 后 台 工 作 线 程 来 达成 目标 。9.4 版 源码 的 contrib/worker_spi 目录 下 实现 了 一 个 小 型 
的 示例 ， 可 供 参 考 。 














1.7 ”数据 库 驱 动 程序 


任何 情况 下 ， 你 都 不 可 能 脱离 具体 的 业务 系统 而 仅仅 使 用 PostgreSQL 数据 库 本 身 ， 那 显然 
是 无 意义 的 。 为 了 实现 PostgreSQL 与 业务 系统 之 间 的 交互 ， 就 需要 借助 数据 库 驱动 程序 。 
PostgreSQL 拥有 大 量 免费 驱动 ， 支 持 各 种 编程 语言 和 开发 工具 。 此 外 ， 很 多 商业 公司 也 以 
很 低廉 的 价格 提供 了 各 有 特色 的 驱动 。 目 前 比较 流行 的 几 种 开源 驱动 如 下 。 















































PHP 驱动 : PHP 语言 广泛 应 用 于 Web 开发 领域 ， 大 多 数 PHP 发 行 包 都 自 带 了 较 老 的 
pgsql 驱动 或 者 是 较 新 的 pdo_pgsqt 驱动 。 一 般 来 说 这 两 种 驱动 默认 都 会 安装 ， 不 过 可 
能 需要 修改 php.ini 来 决定 启用 哪 一 种 。 

JDBC 驱动 : Java 开发 所 使 用 的 JDBC 驱动 一 直 是 与 最 新 版 PostgreSQL 同步 更 新 的 ， 可 
以 从 PostgreSQL 官方 站 点 下 载 。 

.NET 驱动 : .NET 框架 〈 含 微软 的 官方 版 和 Mono 社区 的 开源 版 ) 可 使 用 Npgsql 驱动 。 
目前 该 驱动 支持 微软 .NET 框架， 包括 微软 Entity Framework 开发 框架 以 及 Mono 开 
源 .NET 框架 。 

ODBC 驱动 : 如 果 需 要 从 微软 Access、Excel 或 者 其 他 支持 ODBC 的 产品 连接 到 
PostgreSQL， 可 从 PostgreSQL 官网 下 载 ODBC 了 驱动， 支持 32 位 和 64 位 两 个 版 本 。 
LibreOffice/OpenOffice 驱动 : LibreOffice 3.5 及 之 后 的 版 本 中 自 带 了 PostgreSQL 驱动 ， 
但 3.5 之 前 的 版 本 以 及 OpenOffice 是 不 带 的 ， 可 以 使 用 JDBC 或 者 SDBC 驱动 。 更 多 细 
节 请 参见 “OO Base and PostgreSQL” 这 篇 博文 。 

Python 驱动 : Python 可 通过 多 种 驱动 访问 PostgreSQL， 目前 psycopg2 是 最 流行 的 一 种 。 
Python 的 Django 开发 框架 对 PostgreSQL 也 有 着 良好 的 支持 。 如 果 你 需要 一 个 关系 一 对 
象 映射 工具 ( 即 通常 所 说 的 ORM 工具 )， 可 以 考虑 使 用 最 广泛 的 SQL Alchemy 工具 ， 
著名 的 外 部 数据 源 封闭 器 开发 平台 Multicorn 内 部 就 使 用 了 它 。 

Ruby 驱动 : 对 Ruby 开发 人 员 来 说 ， 请 使 用 rubygems pg 驱动 。 

Perl 驱动 : Perl 可 以 使 用 DBI 和 DBD::Pg 驱动 。 也 可 以 使 用 由 CPAN 网 站 提供 的 
DBD::PgPP 驱动 。 

Node.js 驱动 : Node.js 是 一 个 JavaScript 框架 ， 可 用 于 构建 可 扩展 的 网 络 应 用 。 该 平台 
目前 支持 两 种 PostgreSQL 驱动 : 一 种 是 Node Postgres， 该 驱动 可 以 选择 是 否 绑 定 本 地 
libpq 库 ， 而 且 基 于 纯 JavaScript (无 须 编译 ) ， 另 一 种 是 Node-DBI。 
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1.8 如 何 获得 帮助 


在 使 用 PostgreSQL 的 过 程 中 ， 你 迟早 会 需要 寻求 帮助 ， 而 且 这 一 天 往往 会 比 预 期 来 得 
早 。 我 们 希望 你 能 够 尽早 了 解 到 求助 的 途径 。 我 们 最 为 推荐 的 途径 是 邮件 列表 ， 不 管 
你 是 PostgreSQL 的 新 用 户 还 是 老 用 户 ， 邮 件 列表 都 能 为 你 解答 技术 问题 。 可 以 先 打 开 
PostgreSQL 邮件 列表 页 面 。 如 果 你 是 新 手 ， 那 么 订阅 PGSQL-General 这 个 邮件 列表 是 最 合 
适 的 。 如 果 你 认为 自己 发 现 了 PostgreSQL 的 bug， 那 么 打开 “PostgreSQL 故障 报告 ”这 个 
页 面 ， 上 面 会 告诉 你 具体 如 何 操作 。 


1.9 PostgreSQL 的 主要 衍生 版 本 


PostgreSQL 使 用 了 MIT/BSD 风格 的 许可 证 ， 任 何人 都 可 以 合法 地 对 其 修改 并 二 次 传播 ， 
因此 对 于 那些 想 创建 自己 数据 库 分 支 的 人 来 说 ，PostgreSQL 是 绝 佳 的 选择 。 在 过 去 的 很 
多 年 间 ， 有 很 多 团队 创建 了 自己 的 PostgreSQL 分 支 版 本 ， 并 且 对 社区 也 做 出 了 相应 的 
馈 ， 有 的 把 自己 的 修改 贡献 回 了 PostgreSQL 的 主干 代码 ， 有 的 对 社区 给 予 了 资金 支持 。 
访问 https://wiki.postgresql.org/wiki/PostgreSQL_derived_databases 这 个 地 址 ， 就 可 以 看 到 
PostgreSQL 数据 库 的 所 有 衍生 产品 。 


很 多 流行 的 分 支 版 本 是 商业 化 的 闭 源 软 件 。 比 如 目前 数据 仓库 领域 使 用 很 广泛 的 Netezza 
就 是 源 自 PostgreSQL。 亚 马 逊 公司 的 Redshift 数据 仓库 事实 上 是 PostgreSQL 的 一 个 分 支 
的 分 支 。 亚 马 逊 还 有 其 他 两 个 与 原生 PostgreSQL 血缘 关系 较 近 的 产品 : Amazon RDS for 
PostgreSQL 和 Amazon Aurora for PostgreSQL。 这 两 个 产品 会 与 PostgreSQL 开源 版 本 的 
主干 代码 保持 同 源 ， 并 确保 与 原生 PostgreSQL 提供 完全 相同 的 SQL 语法 ， 同 时 额外 提 
供 了 更 强 的 管理 功能 并 在 速度 方面 做 了 一 些 优化 。EnterpriseDB 公司 推出 的 PostgreSQL 
Advanced Plus 也 是 以 PostgreSQL 为 基础 ， 另 外 增加 了 对 于 Oracle 语法 和 特性 的 兼容 支持 ， 
以 吸引 原 Oracle 用 户 。EnterpriseDB 公司 向 PostgreSQL 社区 提供 了 资金 和 开发 力量 的 支 
持 ， 对 此 我 们 表示 感谢 。 他 们 的 Postgres Plus Advanced Server 产品 在 版 本 更 新 节奏 上 也 一 
直 是 密切 跟 进 最 新 的 PostgreSQL 稳定 版 的 。 


Postgre-X2、Postgres-XL 和 GreenPlum 是 三 款 还 处 于 发 展 初期 的 PostgreSQL 开源 衍生 产 
品 ， 其 中 GreenPlum 曾经 有 一 段 时 间 是 财产 的 。 这 三 款 产品 的 目标 都 是 处 理 大 规模 数据 分 
析 和 复制 工作 。 


PostgreSQL 之 所 以 衍生 版 本 众多 ， 部 分 原因 是 主干 版 本 对 于 一 些小 众 的 需求 可 能 不 会 及 时 
支持 ， 另 外 主干 版 本 的 发 布 节奏 也 不 能 满足 所 有 人 的 要 求 ， 那 么 自己 拉 出 来 一 个 分 支 版 本 
提前 进行 修改 和 测试 就 是 更 好 的 选择 。 很 多 这 种 分 支 版 本 中 开发 出 来 的 新 特性 最 终 都 汇合 
到 了 主 千 ， 比 如 2nd Quadrant 公司 支持 多 主 和 双向 复制 特性 的 BDR 产品 分 支 中 的 逻辑 复 
制 功能 就 被 汇合 入 了 主干 ， 用 于 强化 PostgreSQL 原生 的 复制 功能 。PostgreSQL-XL 中 开发 
的 一 些 并 行 化 特性 将 来 也 可 能 会 合 入 PostgreSQL 主干 中 。 


Citus 是 一 个 支持 实时 大 数据 处 理 和 并 行 查询 功能 的 PostgreSQL 分 支 ， 从 PostgreSQL 9.5 
开始 它 被 改造 成 了 PostgreSQL 的 一 个 扩展 包 ， 使 用 起 来 更 加 方便 。 


Google 最 近 发 布 了 它 的 Google Cloud SQL for PostgreSQL 产品 ， 目 前 还 处 在 beta 测试 阶段 。 
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本 章 涵 盖 了 管理 PostgreSQL 服务 器 需要 了 解 的 一 些 基本 操作 ， 包 括 角色 与 权限 管理 、 
database 的 创建 、 安 装 扩展 包 、 数 据 备 份 与 恢复 等 。 在 开始 之 前 ， 请 先 安装 好 PostgreSQL 
及 其 相应 的 管理 工具 ， 并 且 要 保证 自己 有 权 任 意 地 调整 和 使 用 该 套 环境 。 


2.1 配置 文件 


配置 文件 控制 着 一 个 PostgreSQL 服务 实例 的 基本 行为 ， 主 要 包含 以 下 三 个 文件 。 


postgresql.conf 
该 文件 包含 一 些 通用 设置 ， 比 如 内 存 分 配 、 新 建 database 的 默认 存储 位 置 、PostgreSQL 
服务 器 的 了 PP 地址 、 日志 的 位 置 以 及 许多 其 他 设置 。 


pg_hba.conf 
该 文件 用 于 控制 PostgreSQL 服务 器 的 访问 权限 ， 有 具体 包括 : 允许 哪些 用 户 连接 到 哪个 
数据 库 ， 人 允许 哪些 卫 地 址 连接 到 本 服务 器 ， 以 及 指定 连接 时 使 用 的 身份 验证 模式 。 
pg_ident.conf 
如 果 该 文件 存在 ， 则 系统 会 基于 文件 内 容 将 当前 登录 的 操作 系统 用 户 映射 为 一 个 
PostgreSQL 数据 库 内 部 用 户 的 身份 来 登录 。 有 些 人 会 把 操作 系统 的 root 用 户 映射 为 
PostgreSQL 的 postgres 超级 用 户 账号 。 


在 PostgreSQL 的 官方 术语 体系 中 ,“ 角 色 ”(role) 就 表示 “用 户 ”(user)， 
但 并 不 是 所 有 的 角色 都 需要 具备 登录 权限 ， 比 如 组 角色 (group role) 通常 就 
不 需要 。 为 了 便于 理解 ， 本 书 中 我 们 还 是 使 用 “用 户 ” 一 词 ， 它 的 含义 就 是 
具备 登录 权限 的 角色 。 


















































如 果 你 在 安装 过 程 中 使 用 了 默认 配置 ， 则 上 述 文件 会 位 于 PostgreSQL 主 数据 文件 夹 中 。 你 
可 以 使 用 任何 文本 编辑 器 来 编辑 这 些 文件 ， 或 者 在 pgAdmin 的 Admin Pack 页 面 上 修改 ， 
详情 请 参见 4.2.3 节 。 如 果 你 不 确定 这 些 文件 的 具体 位 置 ， 以 超级 用 户 身 份 连接 到 任何 一 
个 数据 库 上 并 执行 示例 2-1 中 的 查询 语句 即 可 找到 。 


示例 2-1 配置 文件 的 位 置 
SELECT name, setting FROM pg_settings WHERE category = 'File Locations ' ; 








name | setting 
de a a De CG 辣 二 的 全 生生 全 和 人 人 全 
config file | /etc/postgresql/9.6/main/postgresql.conf 
data_directory | /var/lib/postgresql/9.6/main 
external_pid file | /var/run/postgresql/9.6-main.pid 
hba_file | /etc/postgresql/9.6/main/pg_hba.conf 
ident_file | /etc/postgresql/9.6/main/pg_ident.conf 
(5 rows) 


2.1.1 让 配置 文件 生效 
有 些 配置 项 修改 后 需要 重启 PostgreSQL 服务 实例 才能 生效 ， 重 启 时 会 关闭 所 有 客户 端 
连接 。 有 的 配置 项 只 需 重新 加 载 一 下 配置 文件 即 可 生效 ， 此 后 连接 上 来 的 新 用 户 都 会 自 
动 读 取 到 新 的 配置 。 重 新 加 载 配置 文件 时 ， 原 来 已 连接 的 用 户 会 话 不 会 受到 影响 。 如 果 
你 不 确定 修改 了 某 个 配置 后 是 否 需 要 重启 ， 请 查看 下 该 配置 项 的 context 属性 ， 如 果 是 
postmaster， 那 么 需要 重启 ， 如 果 是 user， 那 么 重新 加 载 配置 文件 即 可 。 
1. 重新 加 载 配置 文件 
有 若干 种 方法 可 以 重新 加 载 配置 文件 ， 其 中 一 种 是 打开 控制 台 窗 口 并 执行 以 下 命令 : 

pg_ctl reload -D 你 的 数据 目录 
如 果 你 在 RedHat Enterprise Linux、CentOS 或 者 是 Ubuntu 中 以 服务 的 形式 安装 了 PostgreSQL， 
那么 执行 以 下 命令 即 可 : 

service postgresql-9.5 reload 
命令 中 的 postgresql-9.5 是 你 的 服务 名 。( 有 的 老 版 本 的 PostgreSQL 的 服务 名 就 是 
postgresql， 不 带 版 本 号 。) 
还 有 一 种 加 载 配置 文件 的 方法 是 以 超级 用 户 身份 登录 到 任何 数据 库 并 执行 以 下 SQL: 

SELECT pg_reload_conf(); 
最 后 还 有 一 种 方法 是 用 pgAdmin 工具 实现 重 加 载 ， 详 情 参 见 4.2.3 节 。 
2. 重启 PostgreSQL 运 行 实例 
一 些 底 层 的 配置 修改 后 必须 重启 PostgreSQL 服务 实例 才能 生效 。 可 以 通过 先 停止 再 启动 
PostgreSQL 后 台 服 务 的 方法 来 完成 此 过 程 。 将 服务 器 直接 断 电 重启 当然 也 可 以 (开玩笑 ， 


尽量 别 这 么 干 )。 


PostgreSQL 运行 实例 无 法 通过 执行 PostgreSQL 本 身 的 命令 行 来 实现 重启 ， 只 能 通过 操作 
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系统 的 命令 来 实现 。 在 Linux/Unix 系统 上 ， 如 果 PostgreSQL 实例 是 以 服务 形式 运行 的 ， 


service postgresql-9.6 restart 
如 果 不 是 以 服务 形式 运行 的 ， 请 执行 : 
pg_ctl restart -D 你 的 数据 目录 
在 Windows 上 ， 请 打开 服务 管理 器 ， 找 到 PostgreSQL 服务 ， 然 后 对 它 点 击 重启 即 可 。 


























2.1.2 postgresql.conf 


postgresql.conf 文件 包含 了 PostgreSQL 服务 正常 运行 所 必需 的 基础 设置 。 你 可 以 在 数据 库 
级 、 用 户 级 、 会 话 级 甚至 是 函数 级 重 载 这 些 设 置 。 "Tuning Your PostgreSQL Server” 这 篇 
文章 详细 介绍 了 如 何 通 过 修改 设置 来 优化 你 的 PostgreSQL 系统 。 


PostgreSQL 9.4 引入 了 一 个 重要 的 变更 : 该 版 本 引入 了 一 个 新 的 名 为 postgresql.auto.conf 
的 配置 文件 ， 甚 中 的 配置 项 会 覆盖 postgresql.conf 的 同名 配置 项 。 建 议 你 不 要 直接 修改 
postgresql.conf， 而 是 优先 修改 postgresql.auto.conf。 


1. 查看 postgresql.conf 中 的 配置 
通过 查询 pg_settings 视图 即 可 查看 所 有 配置 项 内 容 ， 无 须 打 开 配 置 文件 。 示 例 2-2 展示 
了 具体 的 查询 语法 。 


示例 2-2 关键 的 设置 

SELECT 
name, 
context ©@, 
unit @, 
setting, boot val, reset val © 

FROM pg_settings 

WHERE name IN ( 'listen addresses','deadlock timeout','shared_ buffers', 
'effective cache_size','work_mem','maintenance_work_mem') 

ORDER BY context, name; 


























name | context | unit | setting | boot val | reset val 
---------------------- +------------+------+---------+-----------+----------- 
Listen_addresses | postmaster | | * | localhost | * 
shared_buffers | postmaster | 8kB | 131584 | 1024 | 131584 
deadlock_timeout | superuser | ms | 1000 | 1000 

effective cache size | user | 8kB | 16384 | 16384 | 16384 
maintenance_work_mem | user | kB | 16384 | 16384 | 16384 
work_mem | user | kB | 5120 | 1024 | 5120 




















@ context 字段 代表 配置 大 小 不 一 ， 具 体 取决 于 


context 字段 的 内 容 。 

context 值 为 user 表示 是 用 户 级 配置 项 ， 它 可 以 被 每 个 用 户 单独 修改 ， 也 就 是 说 该 配置 
项 针对 每 个 用 户 都 可 以 有 不 同 的 值 ， 用 户 修改 后 会 在 自己 的 所 有 会 话 中 生效 。 如 果 是 超 
级 用 户 修改 了 一 个 user 级 的 配置 项 ， 那 么 所 有 此 后 连接 上 来 的 用 户 都 会 将 这 个 修改 过 
的 值 作 为 默认 值 。 


洽 


的 作用 范围 。 各 配置 项 的 作用 范 上 
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context 值 为 superuser 表示 是 超级 用 户 级 配置 项 ， 只 能 由 超级 用 户 来 修改 ， 修 改 并 且 重 
新 加 载 后 会 在 所 有 用 户 会 话 中 生效 。 非 超级 用 户 不 能 在 自己 的 会 话 中 修改 覆盖 这 个 值 。 


context 值 为 postmaster 表示 是 整个 服务 实例 级 配置 项 (postmaster 就 代表 了 
PostgreSQL 服务 实例 ) ， 更 改 后 需要 重启 PostgreSQL 服务 才能 生效 。 


context 为 user 和 superuser 的 配置 项 可 以 在 database 级 、 用 户 级 、 会 话 级 和 国 数 级 分 
别 设置 。 比 如 对 于 一 个 能 写 出 非常 烧 脑 的 SQL 的 专家 用 户 来 说 ，work_men 参数 应 该 设 
置 得 大 一 些 。 又 比如 ， 如 果 有 一 个 函数 里 面 会 进行 密集 的 排序 操作 ， 那 么 可 以 仅 针 对 此 
国 数 调 大 work_men 的 值 。database 级 、 用 户 级 、 会 话 级 和 函数 级 的 参数 设置 不 需要 执行 
重 加 载 操 作 。 数 据 库 级 的 参数 设置 会 在 用 户 下 次 连接 到 该 数据 库 时 生效 。 会 话 和 函数 级 
的 参数 设置 立即 生效 。 

请 注意 内 存 相 关 参 数 所 使 用 的 单位 。 在 示例 2-2 的 输出 结果 中 ， 内 存 相 关 参 数 有 些 以 
8KB 为 单位 ， 有 些 以 KB 为 单位 。 不 管 最 终 显 示 时 用 的 是 什么 单位 ， 设 置 时 都 可 以 用 任 
何 你 觉得 方便 的 单位 。 对 于 大 多 数 内 存 相 关 配 置 项 来 说 ，128MB 是 一 个 比较 合适 的 值 。 

我 们 认为 以 8KB 为 单位 来 显示 内 存 配 置 是 一 种 很 糟糕 的 做 法 ， 看 起 来 很 不 直观 ， 也 容 
易 改 错 。 可 以 用 SHOW 命令 来 查看 配置 项 ， 它 的 输出 结果 会 自动 根据 数值 大 小 选择 合适 
的 单位 来 呈现 ， 比 较 直 观 。 例 如 : 执行 SHOW shared_buffers; 显示 的 结果 是 1028MB (而 
非 前 面 查 出 来 的 131 584 个 8KB)。 类 似 地 ， 运 行 SHOW deadlock_timeout; 返回 的 是 1s 
(而 非 前 面 查 出 来 的 1000 ms)。 如 果 你 想 以 合适 的 单位 查看 所 有 参数 ， 请 执行 SHOW ALL。 

setting 是 指 当 前 设置 ，boot_val 是 指 默 认 设 置 ，reset_val 是 指 重新 启动 服务 器 或 重新 
加 载 设置 之 后 的 新 设置 。 修 改 了 设置 后 ,一 定 要 记得 查看 一 下 setting 和 reset_val 并 确 
保 二 者 是 一 致 的 ， 否 则 说 明 设 置 并 未 生效 ， 需 要 重新 启动 服务 器 或 者 重新 加 载 设置 。 








































































































9.5 版 中 引入 了 一 个 新 的 pg_file_settings 视图 ， 通 过 该 视图 也 可 以 进行 配置 信息 查询 。 
查询 该 视图 会 列 出 每 个 配置 项 所 属 的 配置 文件 。 其 中 applied 字段 表示 该 配置 项 是 否 已 
经 生效 ， 如 果 值 为 f， 表 示 需 要 重启 服务 器 或 者 重 加 载 配置 文件 。 如 果 postgresql.conf 和 
postgresql.auto.conf 中 存在 同名 配置 ， 那 么 后 者 会 覆盖 前 者 ， 前 者 在 pg_file_settings 中 
对 应 的 条 目 会 显示 applied 字段 为 f。 有 具体 如 示例 2-3 所 示 。 


示例 2-3 查询 pg_file_settings 视图 




















SELECT name, sourcefile, sourceline, setting, applied 

FROM pg_file settings 

WHERE name IN ('listen addresses','deadlock timeout','shared_ buffers', 
'effective cache_size','work_mem','maintenance work_mem') 

ORDER BY name; 


name | sourcefile | sourceline | setting | applied 
--------------------- +-------------------------------+------------+---------+-------- 
effective_cache_size | E:/data96/postgresql.auto.conf| 11 | 8GB | 七 
listen_addresses | E:/data96/postgresqL.conf | 59 | * | t 
maintenance_work_mem | E:/data96/postgresqL.auto.conf| 3 | 16MB | t 
shared_buffers | E:/data96/postgresql.conf | 115 | 128MB |f 
shared_buffers | E:/data96/postgresqL.auto.conf| 5 | 131584 | t 

















请 特别 注意 postgresql.conf 或 者 postgresql.auto.conf 中 的 以 下 网 络 设置 ， 如 果 设 得 不 对 会 导 
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致 客户 端 无 法 连接 ， 修 改 这 些 值 是 一 定 要 重新 启动 数据 库 服务 的 。 

listen addresses 
表示 PostgreSQL 服务 使 用 的 全 地址 ， 一 般 会 设置 为 localhost， 表 示 本 机 的 IPV6 或 者 
IPV4 地 址 。 但 也 有 很 多 人 会 设置 为 *， 表 示 使 用 任意 本 机 人 P 地 址 均 可 连接 到 PostgreSQL 
服务 。 

port 
PostgreSQL 服务 的 侦 听 端口 ， 默 认 值 为 5432。 这 个 端口 广为人知 ， 因 此 建议 修改 为 
别 的 端口 ， 这 样 可 以 降低 受 攻击 的 概率 。 当 然 ， 如 果 你 在 同一 台 机 器 上 启动 了 多 个 
PostgreSQL 服务 实例 ， 那 么 每 个 服务 实例 的 侦 听 端口 都 不 能 重复 ， 此 时 也 需要 修改 该 
配置 。 


max_connections 
系统 允许 的 最 大 并 发 连接 数 。 
log_destination 
这 个 配置 项 的 名 字 可 能 有 点 误导 ， 它 实际 指 的 是 日 志文 件 的 输出 格式 而 非 输 出 的 物理 
位 置 。 默 认 值 是 stderr。 如 果 你 希望 保存 日 志 内 容 以 做 进一步 分 析 ， 建 议 把 它 修改 为 
csvlog， 这 样 就 更 容易 将 日 志 导 入 第 三 方 日 志 分 析 工 具 中 使 用 。 注 意 ， 如 果 希 望 记 日 志 
的 话 ， 请 一 定 要 将 logging_collection 配置 项 设 为 on。 


下 面 介 绍 的 几 个 配置 项 会 影响 整体 系统 性 能 ， 其 默认 值 一 般 都 不 是 最 优 的 。 建 议 用 户 对 它 

们 有 所 了 解 后 尽快 根据 实际 情况 做 优化 调整 。 

shared_buffers 
此 设置 定义 了 用 于 缓存 最 近 访 问 过 的 数据 页 的 内 存 区 大 小 ， 所 有 用 户 会 话 均 可 共享 此 缓 
存 区 。 此 设置 对 查询 速度 有 着 重大 影响 ， 一 般 来 说 设置 得 越 大 越 好 ， 至 少 应 该 达到 系统 
总 内 存 的 25%， 但 不 宜 超过 8GB， 因 为 超过 后 会 出 现 “ 边 际 收益 递减 ”效应 ， 即 消耗 的 
内 存 很 多 ， 但 得 到 的 速度 提升 却 很 少 ， 得 不 偿 失 。 修 改 此 设置 需要 重启 PostgreSQL 服务 。 

effective_cache_size 
该 配置 项 是 一 个 估算 值 ， 表 示 操 作 系 统 分 配 多 少 内 存 给 PostgreSQL 专用 。 系 统 并 不 会 
根据 这 个 值 来 真实 地 分 配 这 么 多 内 存 ， 但 是 规划 器 会 根据 这 个 值 来 判断 系统 能 否 提供 查 
询 执行 过 程 中 所 需 的 内 存 。 如 果 将 此 设置 设 得 过 小 ， 远 远 小 于 系统 的 真实 可 用 内 存量 ， 
那么 可 能 会 给 规划 器 造成 误导 ， 让 规划 器 认为 系统 可 用 内 存 有 限 ， 从 而 选择 不 使 用 索引 
而 是 执行 全 表 扫 描 (因为 使 用 索引 虽然 速度 快 ， 但 需要 占用 更 多 的 中 间 内 存 )。 在 一 台 
专用 于 运行 PostgreSQL 数据 库 服务 的 服务 器 上 ， 建 议 将 effective_cache_size 的 值 设 
为 系统 总 内 存 的 一 半 或 者 更 多 。 此 设置 的 更 改 可 动态 生效 ， 执 行 重新 加 载 即 可 。 

work_menm 
此 设置 指定 了 用 于 执行 排序 、 散 列 关联 、 表 扫描 等 操作 的 最 大 内 存 大 小 。 要 得 到 此 设置 
的 最 优 值 需要 考虑 以 下 因素 : 数据 库 的 使 用 方式 ， 需 要 预 留 多 少 内存 给 除数 据 库 系统 外 
的 程序 ， 以 及 服务 器 是 否 专用 于 运行 PostgreSQL 服务 等 问题 。 如 果 使 用 场景 仅仅 是 有 
很 多 用 户 并 发 执行 简单 查询 ， 那 么 这 个 值 可 以 设 得 小 一 点 ， 这 样 每 个 用 户 都 得 以 较为 公 
平地 使 用 内 存 ， 否 则 第 一 个 用 户 就 可 能 把 内 存 占 光 。 这 个 值 该 设 多 大 同样 取决 于 你 的 机 
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器 上 总 共有 多 少 内 存 可 用 。 关 于 work_men 设置 有 一 篇 很 好 的 文章 “Understanding work_ 
mem”。 此 设置 的 更 改 可 动态 生效 ， 执 行 重新 加 载 即 可 。 

maintenance_work_mem 
此 设置 指定 了 可 用 于 vaccum ( 即 清空 已 标记 为 “被 删除 ”状态 的 记录 ) 这 类 系统 内 部 
维护 操作 的 内 存 总 量 。 其 值 不 应 大 于 1GB。 此 设置 的 更 改 可 动态 生效 ， 执 行 重新 加 载 
即 可 。 


max_parallel workers_per_gather 
这 是 9.6 版 中 新 引入 的 一 个 配置 项 ， 用 于 控制 语句 执行 的 并 行 度 。 该 配置 项 决定 了 执行 
计划 的 每 个 gather 市 点 中 最 多 允许 启动 多 少 个 worker 进程 并 行 工作 。 默 认 值 为 0， 表 
示 不 启用 并 行 功 能 。 如 果 你 的 PostgreSQL 服务 器 是 多 核 的 ， 那 么 建议 评估 后 尝试 开启 
此 参数 。 并 行 处 理 是 9.6 版 开始 支持 的 新 特性 ， 因 此 你 需要 做 一 些 测试 来 验证 到 底 将 并 
行 度 设 为 多 大 时 效果 最 好 。 另 外 ， 注 意 该 配置 项 的 值 应 该 小 于 max_worker_processes 的 
值 (默认 为 8) ， 因 为 用 于 并 行 处 理 的 后 台 worker 进程 是 系统 总 体 后 台 worker 进程 的 一 
部 分 。 
版 本 10 中 引入 了 一 个 新 的 参数 叫 作 max_paratllel_workers， 用 于 控制 所 有 后 台 worker 
进程 中 有 多 少 可 用 于 并 行 。 
2. 修改 postgresql.conf 中 配置 项 的 值 
PostgreSQL 9.4 中 引入 了 对 新 的 ALTER SYSTEM SQL 命令 的 支持 ， 使 用 该 命令 可 以 更 改 设 
置 。 例 如 ， 如 果 要 设置 一 个 全 局 生效 的 work_mem， 执 行 以 下 命令 即 可 : 
ALTER SYSTEM SET work_mem = '500MB '; 
该 命令 不 会 直接 修改 postgresql.conf 文件 本 身 ， 而 是 会 去 修改 postgresql.auto.conf 文件 。 
每 个 设置 有 着 各 自 不 同 的 特性 ， 有 的 更 改 后 必须 重启 数据 库 服 务 才能 生效 ， 有 的 只 要 重新 
加 载 一 次 就 可 以 了 ， 下 面 这 个 命令 可 以 实现 设置 重新 加 载 : 
SELECT pg_reload_conf(); 
如 果 你 需要 时 常 修改 很 多 配置 项 ， 那 么 可 以 尝试 将 它们 分 门 别 类 存放 到 多 个 配置 文件 中 ， 
然后 通过 在 postgresql.conf 中 使 用 include 或 者 include_if_exists 前 级 来 引入 这 些 配 置 文 
件 。 具 体 语法 如 下 : 
include ' 配 置 文 件 名 ' 
这 里 的 配置 文件 名 可 以 是 绝对 路 径 也 可 以 是 相对 路 径 ， 相 对 路 径 的 起 始 位 置 就 是 
postgresql.conf 文件 本 身 所 在 的 位 置 。 
3.“ 我 修改 了 postgresql.conf 文 件 ， 结 果 数 据 库 服务 无 法 启动 了 ， 该 怎么 办 ? ” 
定位 这 种 问题 最 简单 的 方法 是 查看 日 志文 件 ， 该 文件 位 于 PostgreSQL 数据 文件 夹 的 根 
目录 或 者 pg_log 子 文件 夹 下 。 只 要 找到 最 近 修 改 的 那个 日 志文 件 并 查看 其 最 后 一 行 的 内 
容 ， 就 能 找到 本 次 问题 的 相关 错误 日 志 。 日 志 的 内 容 一 般 都 是 比较 直 白 易 懂 的 ， 你 看 了 
就 会 明白 。 































































































最 常见 的 错误 是 把 shared_buffers 设 得 太 大 了 。 还 有 一 个 常见 问题 是 由 于 上 次 系统 异常 关 
闭 导 致 遗留 了 一 个 没 来 得 及 删除 的 postmaster.pid 文件 ， 该 文件 就 位 于 数据 文件 夹 下 ， 你 可 
以 手动 删除 该 文件 并 重新 启动 PostgreSQL。 








2.1.3 pg_hba.conf 


pg_hba.conf 文件 指定 了 哪些 IP 地 址 和 哪些 用 户 可 以 连接 到 PostgreSQL 数据 库 ， 同 时 还 规 
定 了 用 户 必 须 使 用 何 种 身份 验证 方式 登录 。 针 对 该 文件 的 修改 可 动态 生效 ， 执 行 一 次 配置 
重 加 载 即 可 。 一 个 典型 的 pg_hba.conf 文件 看 起 来 如 示例 2-4 所 示 。 


示例 2-4 pg_hba.conf 文件 示例 








上 由 


# TYPE DATABASE USER ADDRESS METHOD 
host all all 127.0.0.1/32 ident @ 
host all all ::1/128 trust @ 
host all all 192.168.54.0/24 md5 © 
hostssl all all 0.0.0.0/0 nd5 @ 

# TYPE DATABASE USER ADDRESS METHOD 


# Allow replication connections from localhost, 
# by a user with replication privilege. © 

#host replication postgres 127.0.0.1/32 trust 
#host replication postgres ::1/128 trust 


@ 身份 验证 模式 。 一 般 有 以 下 儿 种 常用 选项 : ident、trust、md5、peer 以 及 password。 


@ 用 于 定义 IPv6 网 段 。 只 有 服务 器 支持 IPv6 时 才 可 以 配置 该 项 ， 如 果 在 非 IPv6 网 络 环 
境 下 配置 了 这 样 的 条 目 ， 会 导致 pg_hba.conf 文件 无 法 加 载 ， 从 而 进一步 导致 任何 客户 
端 都 无 法 连接 。 

日 用 于 定义 IPv4 网 段 。 第 一 部 分 是 网 络 地 址 , 后 面 跟着 的 是 子 网 掩 码 ， 比 如 192.168.54.0/24。 
这 样 定义 的 效果 是 该 子 网 中 的 任何 客户 端 都 可 以 连 到 本 PostgreSQL 实例 。 


@ 这 是 针对 SSL 连接 的 规则 。 本 例 中 ， 任 何 能 使 用 SSL 方式 连接 的 客户 端 都 可 以 连接 到 
本 PostgreSQL 实例 。 


SSL 相关 配置 都 在 postgresql.conf 和 postgresql.auto.conf 中 ， 包 含 以 下 几 项 : ssL、ssL_ 
cert_file、ssl_key_file。 一 旦 确认 客户 端 支持 SSL，PostgreSQL 服务 端 就 会 接受 其 
连接 请 求 ， 并 且 该 连接 上 所 有 传输 的 内 容 都 会 使 用 ssl key 加 密 。 


@ 这 是 允许 与 本 市 点 构成 复制 关系 的 其 他 PostgreSQL 服务 器 节点 的 IP 网 段 。 


对 于 每 一 个 连接 请 求 ，postgres 服务 会 按照 pg_hba.conf 文件 中 记录 的 规则 条 目 自 上 而 下 
进行 检查 。 当 匹配 到 第 一 条 允许 此 请 求 接 入 的 规则 时 ， 就 不 再 往 下 检查 ， 系 统 将 允许 该 连 
接 请 求 。 类 似 地 ， 如 果 匹 配 到 一 条 拒绝 此 连接 请 求 的 规则 ， 也 不 再 继续 检查 ， 并 拒绝 该 连 
接 请 求 。 如 果 一 直 搜 索 到 文件 的 末尾 都 没 能 找到 匹配 项 ， 那 么 该 连接 请 求 会 被 拒绝 。 大 
家 常 犯 的 一 个 错误 是 把 规则 的 顺序 放 错 。 例 如 ， 如 果 你 将 +0.9.0.9/0 reject+ 规则 放 到 
+127.0.0.1/32 trust 的 前 面 ， 那 么 此 时 本 地 用 户 全 都 无 法 连接 ， 即 使 下 面 有 规则 允许 也 不 行 。 


PostgreSQL 10 中 引入 了 一 个 新 的 名 为 pg_hba_file_rules 的 视图 ， 通 过 查询 该 视图 可 以 直 
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接 看 到 pg_hba.conf 中 的 内 容 。 


1. “我 修改 了 pg_hba.conf 文 件 ， 结 果 服 务 器 崩溃 了 ， 该 怎么 办 ? ” 

不 用 担心 ， 这 种 事情 经 常 发 生 ， 解 决 起 来 不 难 。 这 一 般 是 因 拼 写 错误 或 增加 了 一 种 不 支持 

的 身份 验证 模式 导致 的 。 如 果 postgres 服务 无 法 正确 地 解析 pg_hba.conf 文件 ， 那 么 为 确 

保 系统 安全 ， 它 会 禁止 所 有 的 连接 请 求 甚至 是 禁止 系统 启动 。 最 简单 的 诊断 方法 是 看 一 下 

日 志 ， 文 件 就 在 数据 文件 夹 的 根 目 录 下 或 者 其 pg_log 子 文件 夹 下 。 可 以 打开 修改 日 期 最 近 

的 日 志文 件 并 看 一 下 最 后 一 行 的 内 容 ， 错 误 提 示 信 息 一 般 就 在 那里 ， 而 且 一 般 都 是 很 好 理 

解 的 。 如 果 你 经 常会 笔 误 ， 改 错 东 西 ， 那 么 请 一 定 记 得 在 修改 配置 文件 之 前 做 个 备份 。 

2. 身份 验证 方法 

PostgreSQL 提供 了 多 种 模式 用 于 用 户 身份 验证 ， 很 可 能 是 所 有 数据 库 里 面 支持 的 模式 最 多 

的 。 大 多 数 人 只 会 用 到 其 中 几 种 最 常见 的 : trust、peer、ident、md5 和 password。 还 有 一 

种 reject 模式 ， 其 作用 是 拒绝 所 有 请 求 。 不 过 别 忘 了 pg_hba.conf 中 还 可 以 定义 其 他 不 同 

层面 的 身份 验证 模式 (比如 gss、sspi、1ldap、radius、cert、pan 等 )， 它 就 好 像 是 整个 

PostgreSQL 服务 器 的 看 门人 ， 确 保 整 个 系统 的 外 部 访问 安全 。 当 然 ， 在 通过 了 这 一 层 外 部 

安全 控制 并 成 功 建立 连接 以 后 ， 连 上 来 的 用 户 仍 需 遵守 角色 权限 和 数据 库 访问 限制 等 内 部 

约束 规则 。 

最 常用 的 身份 验证 方法 有 以 下 这 些 。 

trust 
这 是 最 不 安全 的 身份 验证 模式 ， 用 户 无 须 提 供 密码 就 可 以 连接 到 数据 库 。 只 要 源 端 
IP 地 址 、 连 接 用 户 名 、 要 访问 的 database 名 都 与 该 条 规则 匹配 ， 用 户 就 可 以 连 上 来 。 
trust 模式 很 不 安全 ， 因 此 应 对 其 使 用 予以 限制 ， 即 只 能 允许 从 数据 库 服务 器 本 机 发 起 
的 连接 或 者 是 同属 内 网 的 用 户 发 起 的 连接 使 用 此 模式 。 但 即使 加 了 前 述 限制 也 不 能 保证 
安全 ， 因 为 会 有 人 通过 伪装 人’ 地址 的 方式 来 冒 用 此 权限 ， 所 以 有 些 安全 意识 比较 强 的 
人 认为 该 模式 应 该 被 彻底 禁用 。 然 而 在 单 用 户 的 桌面 环境 下 ， 这 却 是 最 常用 的 身份 验证 
模式 ， 因 为 一 般 这 种 场景 下 系统 的 安全 性 根本 不 是 问题 。 
















































































































































































md5 

该 模式 很 党 用， 要求 连接 发 起 者 携带 用 md5 算法 加 密 的 密码 。 
password 

该 模式 要 求 连接 发 起 者 携带 明文 密码 进行 身份 验证 。 
ident 


该 身份 验证 模式 下 ， 系 统 会 将 请 求 发 起 者 的 操作 系统 用 户 映 射 为 PostgreSQL 数据 库 内 
部 用 户 ， 并 以 该 内 部 用 户 的 权限 登录 ， 且 此 时 无 须 提供 登录 密码 。Windows 上 不 支持 
ident 验证 方式 。 

peer 
该 模式 下 系统 会 直接 从 操作 系统 内 核 获取 当前 连接 发 起 者 的 操作 系统 用 户 名 ， 如 果 与 
其 请 求 连接 的 PostgreSQL 用 户 名 一 致 ， 即 可 连接 成 功 。 该 模式 仅 可 用 于 Linux、BSD、 
MacOSX 和 Solaris， 并 且 仅 可 用 于 本 地 服务 器 发 起 的 连接 。 
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cert 
该 模式 要 求 客户 端 必须 使 用 SSL 方式 进行 连接 。 连 接 发 起 者 必须 提供 一 个 合法 的 SSL 
证 书 。 该 模式 使 用 一 个 身份 认证 文件 (比如 pg_ident) 来 将 SSL 证 书 映射 为 PostgreSQL 
数据 库 的 内 部 用 户 ， 该 模式 在 所 有 支持 SSL 连接 的 平台 上 都 可 用 。 
另外 还 有 一 些 不 常见 的 验证 方式 ， 比 如 gss、radius、Ldap 和 pam。 有 的 可 能 不 会 默认 安装 。 
多 种 身份 验证 模式 是 可 以 同时 使 用 的 ， 即 使 是 针对 同一 个 database 也 可 以 这 么 做 ， 也 就 是 
说 我 们 可 以 针对 同一 个 database 设置 多 条 身份 验证 规则 ， 并 且 每 条 规则 的 身份 验证 模式 都 
不 一 样 。 但 请 你 务必 牢记 PostgreSQL 对 于 pg_hba.conf 中 的 规则 的 查找 顺序 是 从 上 到 下 ， 
第 一 条 匹配 到 的 规则 就 是 系统 使 用 的 规则 。 


L en 

2.2 连接 管理 
我 们 可 能 时 不 时 地 会 遇 到 一 些 想 要 终止 数据 库 连 接 的 情况 ， 比 如 有 人 执行 了 写 得 很 糟糕 的 
SQL 语句 把 系统 资源 耗 光 ， 当 然 这 肯定 不 是 他 的 本 意 ， 又 比如 你 在 执行 某 些 语句 时 发 现 其 
耗 时 太 长 ， 超 出 了 自己 的 忍耐 极限 。 发 生 这 些 情况 时 ， 我 们 一 般 都 会 希望 结束 这 些 操作 或 
者 干脆 彻底 终止 这 个 连接 。 
强行 中 断 语句 执行 或 者 终止 连接 是 一 种 很 不 “优雅 ”的 行为 ， 应 当 尽 量 避 免 。 在 客户 端 应 
用 程序 中 ， 首 先 应 该 采取 措施 防止 或 者 想 办 法 解决 SQL 语句 出 现 失 控 ( 耗 时 长 或 者 占 资源 
多 ) 的 情况 ， 然 后 再 考虑 通过 在 后 台 直 接 杀 掉 的 方式 处 理 。 出 于 礼貌 ， 你 应 该 在 终止 连接 
之 前 通知 相关 用 户 其 连接 即将 被 强行 终止 ， 或 者 如 果实 在 有 必要 ， 你 也 可 以 不 管 它 什么 礼 
貌 不 礼貌 ， 等 四 下 无 人 时 直接 终止 这 些 连接 就 好 了 。 
有 的 场景 下 我 们 会 需要 杀 掉 所 有 正在 运行 的 更 新 操作 ， 比 如 备份 数据 库 之 前 以 及 恢复 数据 
库 之 前 。 
要 想 终 止 正 在 执行 的 语句 并 杀 掉 连接 ， 请 使 用 以 下 步骤 。 
(1) 查 出 活动 连接 列表 及 其 进程 ID。 

SELECT * FROM pg_stat_activity; 

pg_stat_activity 视图 包含 每 个 连接 上 最 近 一 次 执行 的 语句 、 使 用 的 用 户 名 (usename 

字段 )、 所 在 的 database 名 (datname 字段 ) 以 及 语句 开始 执行 的 时 间 。 通 过 查询 该 视图 

可 以 找到 需要 终止 的 会 话 所 对 应 的 进程 ID， 
(2) 取消 连接 (假设 对 应 的 进程 号 是 1234) 上 的 活动 查询 。 

SELECT pg_cancel_backend(1234); 

该 操作 不 会 终止 连接 本 身 。 
(3) 终止 该 连接 。 

SELECT pg_terminate_backend(1234); 


有 时 候 你 会 需要 终止 这 个 连接 ， 特 别 是 执行 数据 库 恢 复 之 前 。 如 有 果 仅仅 是 终止 了 正在 执 
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行 的 语句 而 没有 彻底 杀 掉 连接 ， 客 户 端 是 可 以 立即 重新 执行 刚刚 被 终止 掉 的 语句 的 ， 这 
又 会 导致 系统 陷入 之 前 的 状态 。 为 了 避免 此 种 情况 的 发 生 ， 可 以 采用 直接 终止 连接 的 方 
式 。 如 果 你 未 停止 某 个 连接 上 正在 执行 的 语句 就 直接 终止 该 连接 ， 那 么 这 些 语句 也 会 被 
停止 掉 。 
PostgreSQL 支持 在 SELECT 查询 语句 中 调用 函数 。 因 此 ， 尽 管 pg_terminate_backend 和 pg_ 
cancel_backend 一 次 仅 能 处 理 一 个 连接 ， 但 你 可 以 通过 在 SELECT 语句 中 调用 函数 的 方式 实 
现 一 次 处 理 多 个 连接 。 例 如 ， 如 果 你 希望 一 次 性 终止 某 个 用 户 的 所 有 连接 ， 那 么 可 以 执行 
以 下 语句 。 
SELECT pg_terminate backend(pid) FROM pg_stat activity 
WHERE Usename = 'some role'; 


PostgreSQL 有 一 些 语句 参数 可 以 用 来 控制 语句 的 运行 状态 ， 一 旦 语句 运行 期 间 的 某 些 状态 
值 超过 了 这 些 运 行 参数 所 限定 的 范围 ， 该 语句 会 被 系统 自动 杀 掉 。 这 些 参 数 可 以 在 服务 实 
例 级 、database 级 、 用 户 级 、 会 话 级 和 函数 级 设置 。 参 数值 设 为 0 代表 禁用 。 
deadlock_timeout 
该 参数 表示 在 进行 死 锁 检 测 之 前 需要 等 待 多 久 。' 默认 是 1000 毫秒 。 如 果 你 的 业务 系统 
中 有 大 量 更 新 操作 ， 那 么 建议 增 大 该 值 以 减少 死 锁 检测 的 次 数 。 
与 其 依赖 这 个 参数 来 解决 死 锁 ， 我 们 更 建议 在 UPDATE 语句 中 加 NONAIT 子 句 来 避免 死 
锁 ， 例 如 :SELECT FOR UPDATE NOWAIT...。 
该 语句 会 在 发 生死 锁 时 自动 终止 执行 。 
在 PostgreSQL 9.5 中 ， 用 户 还 有 男 一 个 选择 : SELECT FOR UPDATE SKIP LOCKED， 该 语法 
可 以 跳 过 已 经 被 别 的 用 户 锁定 的 记录 。 
statement_timeout 
该 参数 可 以 控制 一 个 语句 能 够 执行 的 最 长 时 间 ， 超 出 限定 的 时 间 后 该 语句 会 被 自动 终 
止 。 该 参数 的 默认 值 是 0， 即 无 限制 。 如 果 你 需要 对 一 个 运行 可 能 耗 时 很 久 的 函数 加 上 
最 长 运行 时 间 限 制 ， 那 么 最 好 不 要 把 这 个 参数 设置 为 全 局 级 别 ， 仅 在 要 控制 的 函数 的 定 
义 中 针对 该 函数 自身 设置 一 下 即 可 。 这 样 可 以 保证 不 会 有 “误杀 ”的 情况 发 生 ， 因 为 我 
们 无 法 预料 别 的 语句 是 否 需 要 执行 更 长 时 间 。 如 果 函 数 因 执 行 时 间 超 长 而 被 终止 ， 那么 
调用 该 函数 的 事务 也 会 跟着 被 回 深 掉 。 
Lock_timeout 
该 参数 控制 锁 等 待 的 最 长 时 间 ， 超 出 限定 时 间 后 等 待 锁 的 语句 就 会 被 自动 终止 。 对 于 执 
行 数 据 更 新 的 语句 来 说 ， 该 参数 有 较 大 价值 ， 因 为 每 次 更 新 数据 之 前 都 必须 先 获 取 待 修 
改 的 记录 上 的 排他 锁 ， 所 以 更 新 语句 之 间 是 最 容易 发 生 锁 等 待 的 。 该 参数 的 默认 值 为 
0， 表 示 不 限制 锁 等 待 的 时 间 。 一 般 会 在 函数 级 或 者 会 话 级 设置 该 参数 。Lock_timeout 
的 值 应 该 设 得 比 statement_timeout 小 ， 否 则 总 会 是 语句 先 超 时 ， 这 样 lock_timeout 就 
毫 无 意义 了 。 











































































































注 1: 死 锁 检测 是 很 昂贵 的 操作 ， 因 此 系统 不 会 每 次 发 生 锁 等 待 时 都 做 死 锁 检 测 。 一 一 译 者 注 
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idle in transaction session timeout 

该 参数 表示 一 个 事务 可 以 处 于 idle 状态 的 最 长 时 间 ， 超 过 限定 的 时 间 后 该 事务 会 被 自动 
回 深 。 该 参数 的 默认 值 为 0， 表示 事务 可 以 永久 处 于 idle 状态。 该 参数 是 9.6 版 3 引入 的 ， 
可 以 起 到 两 个 作用 : 防止 一 个 空间 事务 占 着 记录 锁 一 直 不 释放 从 而 阻塞 别 的 事务 继续 运 
行 ， 还 可 以 防止 一 个 数据 库 连 接 被 一 个 空间 事务 永远 占用 。 


查看 被 阻塞 语句 的 情况 


从 9.1 版 开始 ，pg_stat_activity 视图 发 生 了 较 大 变化 ， 一 些 字段 的 名 称 发 生 了 变化 ， 一 些 
字段 被 删除 了 ， 另 外 也 新 增 了 一 些 字段 。 从 9.2 版 开始 ， 该 视图 中 原来 的 procpid 字段 被 改 
名 为 pid。 

在 PostgreSQL 9.6 中 ，pg_stat_activity 视图 中 增加 了 更 多 关于 等 待 锁 的 语句 的 信息 。 在 
之 前 的 版 本 中 ， 有 一 个 名 为 waiting 的 布尔 型 字段 ， 其 值 为 true 时 表示 该 会 话 上 有 个 语句 
正在 等 待 别 的 语句 释放 资源 ， 但 看 不 出 是 在 等 待 获取 什么 资源 。9.6 版 中 ，waiting 字段 被 
取消 ， 替 代 它 的 是 两 个 名 为 wait_event_type 和 wait_event 的 字段 ， 其 中 记录 了 当前 会 话 
上 的 语句 在 等 待 什么 资源 。 因 此 在 9.6 版 之 前 ， 可 以 使 用 waiting = true 过 滤 条 件 查 出 所 
有 被 别人 阻塞 的 语句 ，9.6 版 之 后 ， 应 更 改 为 使 用 wait_event IS NOT NULL 过 滤 条 件 来 查 
找 被 阻塞 的 语句 。 


除了 pg_stat_activity 视图 的 结构 发 生 了 变化 外 ，PostgreSQL 9.6 中 还 对 一 些 之 前 版 本 中 
无 法 通过 waiting = true 过 滤 出 来 的 锁 等 待 进行 了 跟踪 ， 这 样 用 户 就 可 以 看 到 之 前 版 本 中 
无 法 查询 出 来 的 更 轻 量 级 的 锁 等 待 。 如 需 了 解 wait_event 字段 所 有 可 能 的 值 ， 请 参考 官方 
手册 中 关于 等 待 事件 名 和 类 型 的 说 明 。 


2.3 角色 


PostgreSQL 中 使 用 角色 (role) 机 制 来 处 理 用 户 身 份 认 证 。 拥 有 登录 数据 库 权 限 的 角色 
称 为 可 登录 角色 (login role)。 一 个 角色 可 以 继承 其 他 角色 的 权限 从 而 成 为 其 成 员 角 色 
(member role) ; 拥有 成 员 角色 的 角色 称 为 组 角色 ” (group role) 。( 一 个 组 角色 可 以 是 另 一 
个 组 角色 的 成 员 角 色 ， 并 且 这 种 角色 间 的 继承 关系 可 以 有 无 限 多 层 ， 但 除非 你 非常 有 把 握 
能 搞定 这 种 多 层 舱 套 关系 ， 否 则 别 这 么 干 ， 因 为 你 最 后 一 定 会 把 自己 搞 糊 涂 。) 拥有 登录 
权限 的 组 角色 称 为 可 登录 的 组 角色 (group login role)。 然 而 ， 基 于 安全 性 的 考虑 ， 数 据 库 
管理 员 一 般 不 会 为 组 角色 授予 登录 权限 ， 因 为 设计 组 角色 的 本 意 是 将 其 作为 一 个 “权限 集 
合 ” 使 用 ， 而 不 是 将 其 作为 一 个 真正 需要 登录 权限 的 用 户 角色 来 使 用 。 一 个 角色 可 被 授予 
超级 用 户 (SUPERUSER) 权限 ， 拥 有 此 权限 的 角色 可 以 彻底 地 控制 PostgreSQL 服务 ， 因 
此 授予 这 种 权限 时 一 定 要 慎重 。 




















































































































注 2: 设计 “组 角色 ”这 一 功能 的 本 意 是 为 了 将 一 组 权限 集中 在 一 起 成 为 一 个 “组 ”"， 然 后 便于 以 “组 ”为 
单位 对 这 些 权限 进行 管理 ， 比 如 可 以 通过 角色 权限 继承 的 方式 一 次 性 将 这 一 组 权限 赋予 其 成 员 角 
色 。 一 一 译 者 注 
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PostgreSQL 从 最 近 的 几 个 版 本 开始 不 再 使 用 “用 户 ” 和 “组 ”这 两 个 术语 。 
但 你 还 会 看 到 有 人 使 用 这 两 个 术语 ， 请 记 住 “用 户 ” 和 “组 ”分 别 代表 “可 
登录 角色 ”和 “组 角色 ”就 好 了 。 为 保持 前 向 兼容 ，CREATE USER 和 CREATE 
GROUP 这 两 个 命令 在 当前 版 本 中 也 是 支持 的 ， 但 最 好 不 要 使 用 它们 ， 请 使 用 
CREATE ROLE。 




















2.3.1 创建 可 登录 角色 
在 PostgreSQL 安装 过 程 中 的 数据 初始 化 阶段 ， 系 统 会 默认 创建 一 个 名 为 postgres 的 可 登 
录 角 色 (同时 会 创建 一 个 名 为 postgres 的 同名 database) 。 你 可 以 通过 前 面 介 绍 过 的 ident 
或 者 peer 身份 验证 机 制 来 将 操作 系统 的 root 用户 映 射 到 数据 库 的 postgres 角色 ， 这 样 可 
以 实现 root 用 户 免 密 登 录 ， 或 者 通过 设置 为 trust 模式 的 效果 也 是 一 样 。 数 据 库 安装 完成 
后 ， 第 一 件 要 做 的 事 就 是 用 psql 或 者 pgAdmin 工具 以 postgres 角色 身份 登录 ， 然 后 创建 
其 他 已 规划 好 的 角色 。pgAdmin 工具 中 有 专门 的 图 形 界面 用 于 创建 角色 ， 如 果 你 希望 用 
SQL 语句 手动 创建 ， 请 参考 示例 2-5 中 的 SQL 语句 。 
示例 2-5 创建 具备 登录 权限 的 角色 

CREATE ROLE leo LOGIN PASSWORD 'king' VALID UNTIL 'infinity' CREATEDB; 
VALID 子 句 是 可 选 的 ， 其 功能 是 为 此 角色 的 权限 设 定 有 效 期 ， 如 果 不 写 则 该 角色 永久 有 效 。 
CREATEDB 子 句 表明 为 此 角色 赋予 了 创建 新 数据 库 的 权限 。 
如 果 要 创建 一 个 具备 超级 用 户 权限 的 角色 ， 可 以 参考 示例 2-6。 当 然 ， 要 想 创建 一 个 超级 
用 户 ， 创 建 者 自身 也 必须 是 一 个 超级 用 户 。 
示例 2-6 创建 具备 超级 用 户 权 限 的 角色 

CREATE ROLE regina LOGIN PASSWORD 'queen' VALID UNTIL '2020-1-1 00:00' SUPERUSER; 
前 面 两 个 例子 中 我 们 创建 的 都 是 可 登录 角色， 如 果 需 要 创建 不 可 登录 的 角色 ， 省 略 掉 
LOGIN PASSWORD 子 句 即 可 。 


2.3.2 创建 组 角色 
一 般 不 应 授予 组 角色 登录 权限 ， 因 为 它 是 作为 其 他 角色 的 容器 而 存在 的 。 当 然 ， 这 只 是 我 
们 基于 实践 经 验 给 出 的 建议 ， 你 也 可 以 为 组 角色 授予 登录 权限 ， 这 完全 没 问 题 。 
可 以 用 以 下 SQL 创建 组 角色 。 

CREATE ROLE royalty INHERIT; 
请 注意 关键 字 INHERIT 的 用 法 。 它 表示 组 角色 royalty 的 任何 一 个 成 员 角 色 都 将 自动 继承 
其 除 “ 超 级 用 户 权限 ”外 的 所 有 权限 。 出 于 安全 考虑 ，PostgreSQL 不 允许 超级 用 户 权限 通 
过 继承 的 方式 传递 。 如 果 不 写 INHERIT， 默 认 也 会 有 INHERIT 的 效果 ， 但 为 了 清晰 起 见 ， 建 
议 还 是 写 上 。 
如 果 和 希望 禁止 组 角色 将 其 权限 授予 成 员 角 色 ， 可 以 加 上 NOINHERIT 关键 字 。 
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以 下 语句 可 以 为 组 角色 添加 成 员 角 色 。 


GRANT royalty TO leo; 
GRANT royalty TO regina; 


有 些 权限 是 无 法 被 继承 的 ， 例 如 前 面 提 过 的 SUPERUSER 超级 用 户 权 限 ， 然 而 成 员 角 色 
可 以 通过 SET ROLE 命令 来 实现 “冒名 顶替 ”其 组 角色 的 身份 ， 从 而 获得 其 父 角 色 所 拥有 
的 SUPERUSER 权限 ， 当 然 这 种 冒名 顶替 的 状态 是 有 期 限 的 ， 仅 限于 当前 会 话 存续 期 间 有 
效 。 举 例如 下 。 


我 们 先 通过 以 下 命令 授予 royalty 组 角色 超级 用 户 权 限 : 


ALTER ROLE royalty SUPERUSER; 


此 时 尽管 leo 是 royalty 的 成 员 角 色 ， 也 继承 了 其 绝 大 多 数 的 权限 ， 但 leo 登录 后 依然 不 具 
SUPERUSER 权限 。 但 执行 以 下 语句 即 可 获取 SUPERUSER 权限 : 


SET ROLE royaLty; 
请 记 住 这 种 方法 获取 的 SUPERUSER 权限 仅 在 会 话 存续 期 间 有 效 。 


虽然 这 个 操作 逻辑 看 起 来 有 点 怪异 ， 但 如 果 你 不 希望 自己 在 登录 后 以 SUPERUSER 的 身份 
犯 下 一 些 无 可 挽回 的 错误 ， 那 么 这 个 方法 值得 考虑 。 

所 有 用 户 都 可 以 使 用 SET ROLE 这 个 命令 ， 但 还 有 一 个 比 它 更 强大 的 命令 : SET SESSION 
AUTHORIZATION， 该 命令 只 允许 具备 SUPERUSER 权限 的 用 户 执 行 。 为 了 便于 理解 ， 我 们 首 
先 介绍 PostgreSQL 中 的 两 个 全 局 变量 : current_user 和 session_user。 执 行 以 下 语句 即 可 
查看 这 两 个 变量 的 值 : 


SELECT session uyser, current_user; 


首次 登录 成 功 后 ， 这 两 个 变量 的 值 相 同 。 执 行 SET ROLE 会 修改 current_user 的 值 ， 执 行 


SET SESSION AUTHORIZATION 会 同时 改变 current_user 和 session_user 的 值 。 

以 下 是 SET ROLE 命令 的 主要 特点 。 

。 SET ROLE 无 须 SUPERUSER 权限 即 可 执行 。 

。 SET ROLE 会 修改 current_user 变量 的 值 ， 但 不 修改 session_user 的 值 。 

。 一 个 具备 SUPERUSER 权限 的 session_user 同名 角色 可 以 通过 SET ROLE 设置 为 任何 用 户 。 

。 韭 超级 用 户 可 以 通过 SET ROLE 设置 为 session_user 同名 角色 或 者 其 所 属 的 组 用 户 。 

。 SET ROLE 命令 可 以 让 执行 角色 获取 到 所 “扮演 ”角色 的 全 部 权限 ，SET SESSION 
AUTHORIZATION 和 SET ROLE 权限 除外 。 


SET SESSION AUTHORIZATION 是 比 SET ROLE 更 为 强大 的 命令 ， 其 关键 特性 如 下 。 


。 只 有 超级 用 户 才 可 以 执行 SET SESSION AUTHORIZATION。 

。 SET SESSION AUTHORIZATION 权限 在 整个 会 话 存续 期 间 都 是 有 效 的 ， 也 就 是 说 即使 超级 
用 户 通过 SET SESSION AUTHORIZATION 来 “扮演 ”了 一 个 非 超级 用 户 ， 只 要 会 话 未 中 断 ， 
都 可 以 在 上 面 再 次 执行 SET SESSION AUTHORIZATION 命令 。 

。 SET SESSION AUTHORIZATION 会 将 current_user 和 session_user 修改 为 要 “扮演 ”的 角色 。 
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具备 超级 用 户 权 限 的 session_user 同名 角色 可 以 通过 SET ROLE 来 “扮演 ”任何 其 他 角色 。 


接 下 来 我 们 通过 一 系列 实验 来 演示 SET ROLE 和 SET SESSION _ AUTHORIZATION 之 间 的 区 别 。 
请 先 以 leo 用 户 的 身份 登录 ， 然 后 运行 示例 2-7 中 的 代码 。 


示例 2-7 SET ROLE 和 SET AUTHORIZATION 


SELECT session user, current uyser; 


session_user | current_user 


SET SESSION AUTHORIZATION regina; 

ERROR: permission denied to set session authorization 
SET ROLE regina; 

ERROR: permission denied to set role "regina" 

ALTER ROLE leo SUPERUSER; 

ERROR: must be superuser to alter superusers 


SET ROLE royalty; 
SELECT session user, current uyser; 


session_user | current_user 
Er a i es 
leo | royalty 


SET ROLE regina; 
ERROR: permission denied to set role "regina" 


ALTER ROLE leo SUPERUSER; 
SET ROLE regina; 
SELECT session user, current uyser; 


session_user | current_user 
Se eye 
leo | regina 


SET SESSION AUTHORIZATION regina; 


ERROR: permission denied to set session authorization 


-- 退出 此 会 话 然后 重新 以 Leo 身 份 登录 
SELECT session User, current uyser; 
SET SESSION AUTHORIZATION regina; 

SELECT session User, current user; 














session_user | current_user 


SET SESSION AUTHORIZATION 

session user | current_user 

regina | regina 

(1 row) 
在 示例 2-7 中 ，leo 用 户 不 是 超级 用 户 ， 因 此 不 能 使 用 SET SESSION AUTHORIZATION 命令 。 
同样 ， 他 也 不 能 通过 SET ROLE 来 扮演 regina 角色 ， 因 为 他 不 是 regina 组 的 成 员 。 然 而 leo 
可 以 通过 SET ROLE 来 扮演 royalty 角色 ， 因 为 他 是 royalty 组 的 成 员 (可 以 把 leo 理解 成 国 
王 的 伙伴 )。 扮 演 为 royalty 角色 后 ， 虽 然 royalty 有 超级 用 户 权 限 ， 但 他 却 不 能 再 次 扮演 女 
王 regina， 因 为 他 并 没有 继承 到 royalty 的 超级 用 户 权 限 ， 所 以 此 时 SET ROLE 所 能 扮演 的 
角色 范围 还 是 非 超级 用 户 leo 所 能 扮演 的 范围 。 由 于 royalty 组 角色 具备 超级 用 户 权 限 ， 因 
此 他 可 以 主动 授予 其 成 员 角 色 leo 超级 用 户 权 限 。 一 旦 leo 被 提 权 成 为 超级 用 户 ， 他 就 可 
以 扮演 regina 了 。 此 时 他 可 以 使 用 SET SESSION AUTHORIZATION 来 完全 获取 regina 用 户 的 权 
限 ，session_user 和 current_user 也 会 都 被 设置 为 regina。 


2.4 创建 database 


一 个 不 含 任何 附加 子 句 的 最 简单 SQL 语句 即 可 创建 一 个 database: 


CREATE DATABASE mydb; 


该 命令 会 以 templatel 库 为 模板 生成 一 份 副本 并 将 此 副本 作为 新 database。 任 何 一 个 拥有 
CREATEDB 权限 的 角色 都 能 够 创建 新 的 database。 


2.4.1 ”模板 数据 库 


顾名思义 ， 模 板 数 据 库 就 是 创建 新 database 时 所 使 用 的 骨架 。 创 建新 database 时 ， 
PostgreSQL 会 基于 模板 数据 库 制作 一 份 副本 ， 其 中 会 包含 所 有 的 数据 库 设置 和 数据 文件 。 


PostgreSQL 安装 好 以 后 默认 附带 两 个 模板 数据 库 : tempLateg 和 tempLate1。 如 有 果 创 建新 库 
时 未 指定 使 用 哪个 模板 ， 那 么 系统 默认 会 使 用 templatel 库 作 为 新 库 的 模板 。 


切记 ， 任 何 时 候 都 不 要 对 template9 模板 数据 库 做 任何 修改 ， 因 为 这 是 原始 
的 干净 模板 ， 如 果 其 他 模板 数据 库 被 搞 坏 了 ， 基 于 这 个 数据 库 做 一 个 副本 就 
可 以 了 。 如 果 你 想 定制 自己 的 模板 数据 库 ， 那 么 请 基于 templatel 进行 修改 ， 
或 者 自己 另外 创建 一 个 模板 数据 库 再 修改 。 对 基于 template1 或 你 自 建 的 模 
板 数据 库 创 建 出 来 的 数据 库 来 说 ， 你 不 能 修改 其 字符 集 编 码 和 排序 规则 。 如 
果 你 想 这 么 做 ， 那 么 请 基于 template 模板 来 创建 新 数据 库 。 






























































基于 某 个 模板 来 创建 新 数据 库 的 基本 语法 如 下 。 
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CREATE DATABASE my_ db TEMPLATE my_template_db; 


你 可 以 使 用 任何 一 个 现存 的 database 作为 创建 新 数据 库 时 的 模板 。 当 需要 对 一 个 现存 的 
database 进行 复制 时 ， 该 功能 特别 有 用 。 此 外 ， 你 还 可 以 将 某 个 现存 的 数据 库 标 记 为 模板 
数据 库 ， 对 于 这 种 被 标记 为 模板 的 数据 库 ，PostgreSQL 会 禁止 对 其 进行 编辑 或 者 删除 。 任 
何 一 个 具备 CREATEDB 权限 的 角色 都 可 以 使 用 这 种 模板 数据 库 。 以 超级 用 户 身份 运行 以 下 
SQL 可 使 任何 数据 库 成 为 模板 数据 库 。 


UPDATE pg_database SET datistemplate = TRUE WHERE datname = "mydb '; 
如 果 你 想 修改 或 者 删除 被 标记 为 模板 的 数据 库 ， 请 先 将 上 述 语句 中 的 datistemplate 字段 


值 改 为 FALSE， 这 样 就 可 以 放 开 编辑 限制 。 如 果 你 还 想 将 此 数据 库 作 为 模板 的 话 ， 修 改 完 
后 记得 将 此 字段 值 改 回来 。 























2.4.2 _ schema 的 使 用 


schema 可 以 对 database 中 的 对 象 进行 逻辑 分 组 管理 。 如 果 你 的 database 中 有 很 多 表 ， 那 
么 管理 起 来 会 很 麻烦 ， 可 以 考虑 把 它们 分 门 别 类 放 到 不 同 schema 中 来 进行 管理 。 同 一 个 
schema 中 的 对 象 名 不 允许 重复 ， 但 同一 个 database 的 不 同 shema 中 的 对 象 是 可 以 重 名 
的 。 如 果 你 将 数据 库 中 所 有 表 都 塞 到 默认 的 pubtlic schema 中 (创建 数据 库 时 默认 创建 的 
schema) ， 迟 早 会 遇 到 对 象 重 名 的 问题 。 你 可 以 自行 决定 如 何 管理 和 组 织 schema。 例 如 ， 
假设 要 为 一 家 航空 公司 设计 IT 系统 ， 那 么 可 以 将 飞机 信息 表 及 其 日 常 维护 信息 表 放 到 一 
个 叫 作 plane 的 schema 中 ， 把 所 有 机 组 人 员 及 其 人 事 信息 放 到 名 为 employees 的 Schema 
中 ， 并 把 所 有 乘客 相关 信息 放 入 名 为 passengers 的 schema 中 ， 这 样 就 把 所 有 信息 分 门 别 
类 隔离 开 了 。 


另外 一 种 常见 的 管理 schema 的 方法 是 基于 角色 的 管理 。 当 系统 拥有 多 个 客户 端 并 且 每 个 
客户 端的 数据 必须 完全 隔离 时 ， 这 种 方法 特别 合适 。 

假设 你 开 了 一 家 “ 完 物 狗 美容 店 ”( 俗 称 狗 狗 SPA)。 刚 开始 你 用 一 张 放 在 public schema 
中 的 名 为 dogs 的 表 来 存储 所 有 宠物 狗 的 信息 。 然 后 你 的 两 个 好 朋友 成 了 你 的 客户 。 最 近 
政府 颁布 了 一 项 新 的 隐私 保护 条 例 ， 要 求 客户 数据 必须 完全 隔离 ， 即 禁止 一 个 客户 看 到 另 
一 个 客户 的 狗 狗 的 任何 信息 。 为 了 达到 这 个 要 求 ， 你 可 以 为 每 个 客户 都 建立 一 个 单独 的 
schema, 每 个 schema 中 建立 同样 的 一 张 dogs 表 。 创 建 schema 的 语句 如 下 : 


CREATE SCHEMA CuUstomer1; 
CREATE SCHEMA customer2; 


然后 你 把 这 些 狗 狗 的 数据 从 单一 的 dogs 表 分 拆 到 不 同 客户 的 schema 的 dogs 表 中 。 最 后 为 
每 个 schema 创建 一 个 与 之 同名 的 可 登录 角色 。 所 有 狗 狗 的 信息 现在 完全 被 分 散 到 它们 对 
应 的 schema 下 。 当 用 户 通过 客户 端 登录 到 你 的 数据 库 进 行 美容 预约 操作 时 ， 他 们 就 只 能 
看 到 他 们 各 自 狗 狗 的 相关 数据 。 


别 急 ， 到 这 儿 还 没完 ， 后面 还 有 更 妙 的 用 法 。 我 们 之 前 让 角色 和 schema 同名 ， 这 样 就 可 
以 用 上 另外 一 种 很 有 用 的 技巧 ， 在 介绍 这 个 技巧 之 前 需要 先 介绍 一 下 search_path 这 个 系 


和 三 隐 
统 变 量 。 








































































































前 面 已 经 说 过 ， 同 一 个 schema 中 的 对 象 是 不 允许 重 名 的 ， 但 不 同 schema 中 的 对 象 可 以 
重 名 。 例 如 ， 在 所 有 12 个 schema 中 都 有 一 张 同名 的 dogs 表 。 那 么 问题 来 了 ， 当 执行 类 
似 SELECT * FROM dogs 这 种 语句 时 ，PostgreSQL 是 怎么 知道 要 查 的 是 哪个 schema 中 的 
表 呢 ?这 个 问题 最 简单 的 解决 办 法 是 在 表 名 前 加 上 所 属 schema 的 名 称 ， 比 如 SELECT * 
FROM customer1.dogs; 另 一 种 方法 是 通过 设置 search_path 变量 来 解决 ， 比 如 可 以 设 定 为 
customer1，public。 当 执行 查询 语句 时 ， 规 划 器 会 先 到 customer1 schema 中 查找 dogs， 找 
不 到 再 到 public schema 中 寻找 ， 再 找 不 到 就 结束 。 

PostgreSQL 有 一 个 罕 为 人 知 的 系统 变量 叫 作 user， 它 代表 了 当前 登录 用 户 的 名 字 。 执 行 
SELECT user 就 能 看 到 其 值 。 系 统 变 量 user 和 current_user 完全 相同 ， 用 哪个 都 一 样 。 

别 忘 了 我 们 前 面 将 schema 的 名 称 取 得 和 登录 用 户 名 一 致 ， 现 在 可 以 充分 利用 这 一 点 了 。 
接 下 来 在 postgresql.conf 中 将 search_path 变量 设 成 下 面 这 样 。 


search_path = "$user", public; 


好 了 ， 如 果 当 前 登录 的 角色 是 customer1， 那 么 所 有 的 查询 都 会 优先 去 customer1 schema 
中 寻找 目标 表 ， 如 果 找 不 到 才 会 去 public schema 下 找 。 最 重要 的 一 点 是 ， 这 样 我 们 系统 
中 的 SQL 语句 就 只 需要 一 种 写法 ， 而 不 用 在 每 个 客户 的 SQL 中 加 上 对 应 的 schema 名 。 这 
样 就 算 你 的 客户 数 增长 到 几 千 个 其 至 是 几 十 万 个 也 没关系 ， 系 统 中 所 有 的 SQL 语句 都 不 需 
要 修改 。 一 些 需 要 所 有 人 共享 的 公共 表 可 以 放 到 public schema 中 。 
我 们 强烈 推荐 为 每 一 个 扩展 包 创 建 一 个 单独 的 schema 来 容纳 其 对 象 (参见 2.6.1 节 )。 安 
装 一 个 新 的 扩展 包 时 ， 会 在 数据 库 服务 器 上 创建 大 量 的 表 、 函 数 、 数 据 类 型 以 及 其 他 对 
象 。 默 认 情 况 下 它们 都 会 被 安装 到 public schema 中 ， 这 样 日 积 月 累 之 后 public schema 里 
面 会 被 搞 得 一 团 糟 。 例 如 ， 完 整 的 PostGIS 扩展 包 安 装 后 会 创建 数 千 个 函数 ， 如 果 你 此 前 
已 经 在 public schema 中 创建 了 一 些 自己 的 表 和 函数 ， 可 以 想象 一 下 ， 在 加 进来 这 几 千 个 
表 和 函数 后 ， 要 从 中 找到 属于 你 自己 的 那些 是 多 么 痛苦 的 一 件 事 情 ! 
在 安装 扩展 包 之 前 ， 先 为 其 创建 一 个 schema， 语 句 如 下 : 

CREATE SCHEMA my_extensions; 
然后 把 这 个 新 的 schema 加 入 search_path: 

ALTER DATABASE mydb SET search_path="'$user', public, my_extensions; 


安装 扩展 包 时 ， 记 得 在 CREATE EXTENSION 语句 中 将 你 为 其 创建 的 新 schema 声明 为 其 归属 


Schema。 










































































对 于 现 有 连接 来 说 ，ALTER DATABASE .. SET search_path 命令 执行 后 是 不 能 
直接 生效 的 ， 你 需要 断 开 此 连接 并 重 连 才 可 以 。 
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2.5 权限 管理 


PostgreSQL 的 权限 管理 机 制 非常 灵活 而 自由 ， 因 此 要 想 管理 得 当 是 需要 一 些 技 巧 的 。 
PostgreSQL 的 权限 控制 甚至 可 以 精确 到 字段 和 记录 级 别 。 是 的 ， 你 没 看 错 ， 如 有 必要 甚至 
可 以 为 同一 张 表 中 每 行 记录 的 每 个 字段 单独 设置 其 访问 权限 。 


行 级 权限 控制 (RLS，row level security) 是 PostgreSQL 9.5 中 首次 引入 的 。 
该 特性 在 所 有 的 PostgreSQL 服务 实例 中 都 可 使 用 ， 但 如 果 PostgreSQL 是 运 
行 在 开启 了 安全 增强 模式 的 Linux (SELinux) 上 ， 还 能 打开 一 些 更 高 级 的 安 
全 控制 特性 。 




















要 想 完 整地 介绍 所 有 关于 权限 管理 的 知识 可 能 需要 好 几 章 的 篇 幅 ， 因 此 本 节 仅 介绍 正常 使 
用 所 必 备 的 知识 ， 同 时 会 指导 你 避 开 一 些 隐 蔽 的 “ 雷 区 ”， 这 些 “ 雷 ”一 旦 踩 到 ， 会 导致 
你 根本 无 法 访问 想 要 访问 的 内 容 ， 或 者 服务 器 上 的 数据 得 不 到 有 效 防护 。 

做 好 PostgreSQL 的 权限 管理 可 不 是 件 很 轻松 的 事 。 利 用 pgAdmin 工具 的 图 形 化 界面 来 进 
行 操作 会 简单 一 些 ， 或 者 说 至 少 能 让 你 比较 清楚 地 了 解 到 系统 当前 权限 设置 的 全 貌 。 通 
过 pgAdmin 可 以 完成 绝 大 多 数 权 限 管理 工作 。 如 果 你 得 负责 权限 管理 工作 而 你 又 是 个 
PostgreSQL 新 手 ， 那 么 建议 使 用 pgAdmin。 如 果 等 不 了 我 们 按部就班 地 慢 慢 介绍 ， 你 也 可 
以 直接 跳 到 4.2.4 节 去 学 习 。 


2.5.1 权限 的 类 型 


PostgreSQL 有 几 十 种 权限 ， 其 中 的 一 些 基 本 不 会 用 到 。 和 常见 的 几 种 权限 包括 SELECT、 
INSERT、UPDATE、ALTER、 EXECUTE 以 及 TRUNCATE。 


大 多 数 权限 需要 上 下 文 ， 也 就 是 需要 绑 定 一 个 特定 的 数据 库 对 象 才 有 意义 。 例 如 ， 一 个 
角色 拥有 ALTER 权限 ， 却 不 指明 在 哪个 数据 库 对 象 上 拥有 此 权限 ， 这 是 没有 意义 的 。 在 
tablel 上 拥有 ALTER 权限 ， 在 table2 上 拥有 SELECT 权限 ， 在 functionl 上 拥有 EXECUTE 权 
限 ， 诸 如 此 类 的 权限 才 有 意义 。 另 外 ， 并 不 是 所 有 权限 都 适用 于 所 有 数据 库 对 象 ， 比 如 一 
张 表 上 的 EXECUTE 权限 就 完全 说 不 通 。 


有 些 权限 无 须 绑 定数 据 库 对 象 ， 比 如 CREATEDB 和 CREATE ROLE 就 是 这 样 。 






























































PostgreSQL 官方 使 用 privilege 来 表示 “权限 ”， 其 他 数据 库 中 “权限 ”一 词 
可 能 用 right 或 者 permission 来 表达 。 


2.5.2 入门 介绍 


假设 你 已 安装 好 PostgreSQL， 创 建 好 了 一 个 超级 用 户 角色 并 设 定 好 了 密码 。 请 参照 以 下 步 
又 来 创建 其 他 角色 并 设 定 其 权限 。 








(1) PostgreSQL 在 安装 阶段 会 默认 创建 一 个 超级 用 户 角 色 以 及 一 个 database， 二 者 的 名 称 都 
是 postgres。 请 以 postgres 身份 登录 服务 器 。 
(2) 在 创建 你 自己 的 首 个 database 之 前 ， 需 要 先 创建 一 个 角色 作为 此 database 的 所 有 者 ， 所 
有 者 可 以 登录 该 库 。 语 法 如 下 : 
CREATE ROLE mydb_admin LOGIN PASSWORD 'something'; 
(3) 创建 database 并 设 定 其 所 有 者 : 


CREATE DATABASE mydb NITH owner = mydb admin; 


(4) 然后 用 mydb_admin 身份 登录 并 创建 schema 和 表 。 























ds 


2.5.3 GRANT 
GRANT 命令 是 授予 权限 的 基本 手段 。 基 本 用 法 如 下 。 


GRANT some_privilege TO some_role; 
请 牢记 以 下 几 条 关于 GRANT 的 使 用 原则 。 


。 很 显然 ， 只 有 权限 的 拥有 者 才能 将 权限 授予 别人 ， 并 且 拥 有 者 自身 还 得 有 GRANT 操作 的 
权限 。 这 一 点 是 不 言 而 喻 的 ， 因 为 自己 没有 的 东西 当然 给 不 了 别人 。 

。 有 些 权 限 只 有 对 象 的 所 有 者 才能 拥有 ， 任 何 情况 下 都 不 能 授予 别人 。 这 类 权限 包括 
DROP 和 ALTER。 

。 对 象 的 所 有 者 天 然 拥 有 此 对 象 的 所 有 权限 ， 不 需要 再 次 授予 。 然 而 请 特别 注意 : 一 个 对 
象 的 所 有 者 并 不 天 然 拥 有 此 对 象 的 子 对 象 。 例 如 ， 虽 然 你 是 某 个 database 的 属 主 ， 但 这 

并 不 意味 着 你 必然 是 该 database 下 所 有 schema 的 属 主 。 

。 授权 时 可 以 加 上 MITH GRANT 子 句 ， 这 意味 着 被 授权 者 可 以 将 得 到 的 权限 再 次 授予 别人 ， 
从 而 实现 权限 传递 。 示 例如 下 。 


GRANT ALL ON ALL TABLES IN SCHEMA public TO mydb_admin NITH GRANT OPTION; 
。 如 果 和 希望 一 次 性 将 某 一 类 对 象 的 所 有 权限 都 授予 某 人 ， 可 以 使 用 ALL 关键 字 来 指 代 所 有 
对 象 ， 而 不 需要 针对 每 一 个 对 象 都 操作 一 遍 。 请 注意 ， 此 处 ALL TABLES 涵盖 了 所 有 的 
普通 表 、 外 部 表 以 及 视图 。 


GRANT SELECT, REFERENCES, TRIGGER ON 
ALL TABLES IN SCHEMA my_schema TO 
PUBLIC; 


。 如 果 和 希望 将 权限 授予 所 有 人 ， 可 以 用 PUBLIC 关键 字 来 指 代 所 有 角色 。 

GRANT USAGE ON SCHEMA my_schema TO PUBLIC; 
官方 手册 的 “GRANT” 一 节 中 对 GRANT 命令 有 极其 详尽 的 说 明 ， 强 烈 推荐 你 先 认真 阅读 一 
下 此 节 ， 以 免 不 小 心 设 错 权限 导致 系统 安全 隐患。 


系统 会 默认 将 某 些 权限 授予 PuBLIC ( 即 所 有 人 )。 这 些 权限 包 括 : CONNECT、CREATE TEMP 
TABLE (针对 database)、EXECUTE (针对 函数 )。 有 些 情况 下 出 于 安全 考虑 ， 你 可 能 希望 取消 
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一 些 默 认 权限 ， 那 么 可 以 使 用 REVOKE 命令 
REVOKE EXECUTE ON ALL FUNCTIONS IN SCHEMA my_schema FROM PUBLIC; 


2.5.4 默认 权限 
默认 权限 可 以 简化 权限 管理 工作 ， 该 机 制 允许 用 户 在 数据 库 对 象 创建 之 前 就 对 其 设置 权限 。 























新 增 或 者 修改 默认 权限 并 不 会 影响 已 有 的 权限 设置 ， 即 只 有 当 某 个 对 象 的 某 
项 权限 未 专门 设 定 的 情况 下 ， 上 默认 权限 设 定 才 会 生效 。 











假设 我 们 希望 对 所 有 数据 库 用 户 都 授予 某 schema 中 将 来 可 能 创建 的 所 有 函数 和 表 的 
EXECUTE 和 SELECT 权限 ， 那 么 我 们 可 以 按 示 例 2-8 这 样 来 定义 权限 。 一 个 PostgreSQL 服务 
实例 中 的 所 有 角色 都 是 PUBLIC 组 的 成 员 。 

示例 2-8 定义 schema 的 默认 权限 


GRANT USAGE ON SCHEMA my_schema TO PUBLIC; © 





ALTER DEFAULT PRIVILEGES IN SCHEMA my_schenma 
GRANT SELECT, REFERENCES ON TABLES TO PUBLIC; @ 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schema 
GRANT ALL ON TABLES TO mydb_admin WITH GRANT OPTION; © 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schena @ 
GRANT SELECT, UPDATE ON SEQUENCES TO public; 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schena © 
GRANT ALL ON FUNCTIONS TO mydb_admin WITH GRANT OPTION; 


ALTER DEFAULT PRIVILEGES IN SCHEMA my_schena © 
GRANT USAGE ON TYPES TO PUBLIC; 


@ 允许 所 有 能 够 连接 到 此 database 的 用 户 在 my_schema 中 访问 和 创建 对 象 ， 同 时 该 用 户 
需要 已 经 具备 访问 此 schema 中 所 有 对 象 的 权限 。 为 用 户 授予 某 个 schema 的 USAGE 权 
限 是 允许 该 用 户 访问 schema 中 所 有 对 象 的 前 提 条 件 。 如 果 用 户 拥有 访问 schema 中 某 张 
表 的 查询 权限 ， 却 没有 该 schema 的 USAGE 权限 ， 则 该 用 户 不 能 访问 这 张 表 。 

@ 为 所 有 具备 此 schema 的 USAGE 权限 的 用 户 授予 该 schema 中 后 续 创 建 的 所 有 表 的 查询 
(SELECT) 和 引用 (REFERENCE) 权限 (引用 权限 指 的 是 针对 该 表 的 某 些 字段 建立 外 键 约 
束 的 权限 ) 。 

@ 把 该 schema 中 所 有 后 续 创建 的 表 的 所 有 权限 都 授予 mydb_admin 角色 。 同 时 还 允 六 
mydb_admin 组 的 所 有 成 员 将 本 schema 中 所 有 后 续 创建 的 表 的 部 分 或 者 全 部 权限 授予 其 
他 用 户 。 所 有 权限 具体 包括 : 插入 记录 、 更 新 记录 、 删 除 记 录 、 截 断 表 、 创 建 触发 器 、 
创建 约束 等 。 

@9696 针对 本 schema 中 后 续 创建 的 序列 号 生成 器 、 函 数 、 数 据 类 型 授予 权限 。 


要 了 解 更 多 关于 默认 权限 的 信息 ， 请 参考 官方 手册 中 “修改 默认 权限 ”一 市 的 内 容 。 
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2.5.5 ”PostgreSQL 权 限 体 系 中 一 些 与 众 不 同 的 特点 
最 后 ， 在 你 自己 去 深入 了 解 权限 管理 体系 之 前 ， 我 们 会 给 你 列举 一 些 比较 隐蔽 的 “ 奇 昔 ” 特 性 。 


与 其 他 数据 库 不 同 ，PostgreSQL 中 一 个 database 的 所 有 者 并 不 天 然 对 此 库 中 的 所 有 对 象 拥 
有 完全 的 控制 权 。 比 如 另 一 个 角色 可 以 在 你 的 库 中 创建 一 张 表 ， 你 虽然 身 为 此 库 的 所 有 者 
却 无 权 访问 这 张 表 ， 然 而 此 时 你 却 有 权 把 整个 库 都 删 掉 。 


在 对 schema 中 的 表 和 函数 做 了 授权 操作 后 ， 一 定 不 要 忘 了 授予 schema 本 身 的 USAGE 权限 。 


2.6 ”扩展 包机 制 


扩展 包 (extension) 是 一 种 用 于 扩展 PostgreSQL 系统 功能 的 插件 机 制 ， 访 机制 的 前 身 被 称 

为 “contrib””。 访 机制 很 好 地 体现 了 开源 界 的 强大 优势 : 人 们 互相 协作 、 共同 开发 并 自由 分 

享 新 的 功能 特性 。 自 从 9.1 版 开始 引入 对 extension 扩展 包机 制 以 来 ， 为 PostgreSQL 添加 

功能 扩展 已 经 变 得 非常 方便 快捷 。 
对 于 在 extension 扩展 包机 制 推出 之 前 就 已 存在 的 那些 历史 插件 ， 理 论 上 我 们 
应 称 之 为 “contrib” 以 示 差 别 ， 但 放眼 未 来 ， 这 些 老 的 contrib 势必 都 会 被 改 
造 为 用 extension 机 制 实现 。 为 了 描述 方便 ， 下 文 会 将 二 者 统称 为 “扩展 包 ”， 
但 你 应 该 清楚 二 者 的 区 别 。 









































对 于 一 台 PostgreSQL 服务 器 来 说 ， 并 不 是 其 中 每 个 database 都 要 安装 全 部 的 扩展 包 ， 只 
当 某 个 database 的 确 需 要 此 扩展 包 提供 的 功能 时 才 应 安装 。 如 果 你 的 PostgreSQL 服务 器 上 
的 所 有 database 都 需要 某 些 扩展 包 的 功能 ， 那 么 可 以 新 建 一 个 模板 数据 库 (有 关 模 板 数 据 
库 的 介绍 ， 请 参见 2.4.1 节 )， 然 后 在 此 模板 数据 库 中 预先 安装 好 这 些 扩展 包 ， 那 么 后 续 的 
database 就 能 以 此 模板 数据 库 为 基础 来 创建 ， 这 样 就 避免 了 每 新 建 一 个 database 就 安装 一 
遍 扩 展 包 的 麻烦 。 
建议 定期 检查 并 印 载 不 再 需要 的 扩展 包 以 避免 系统 过 于 腾 肿 。 将 不 再 需要 的 老 扩展 包 保 留 
在 系统 中 可 能 会 在 PostgreSQL 升级 过 程 中 引发 问题 ， 因 为 升级 后 的 PostgreSQL 中 需要 把 
这 些 扩展 包 所 含有 的 对 象 原 地 重建 一 遍 。 

要 想 查看 某 个 database 中 已 经 安装 了 哪些 扩展 包 ， 可 以 连接 到 该 database， 然 后 执行 示例 
2-9 中 的 语句 。 你 的 查询 结果 可 能 和 下 面 列 出 的 很 不 一 样 ， 这 是 正常 的 。 


示例 2-9 查询 某 个 database 中 已 安装 的 扩展 
SELECT name, default version, installed version, left(comment,30) As comment 
FROM pg_available extensions 
WHERE installed_version IS NOT NULL 
ORDER BY name; 





















































注 3: extension 与 contrib 本 质 上 都 是 PostgreSQL 的 系统 功能 插件 ， 二 者 功能 类 似 但 实现 机 制 有 很 大 差异 ， 
其 版 本 分 界 点 为 9.1 版 ， 之 前 的 插件 机 制 被 称 为 contrib，9.1 版 及 之 后 的 插件 机 制 被 称 为 extension。 
译 者 注 
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name | default_version | installed version | comment 

--------------- 4 
btree_gist | 1.5 | 1.5 | support for indexing common da 
fuzzystrmatch | 1.1 | 1.1 | determine similarities and dis 
hstore | 1.4 | 1.4 | data type for storing sets of 
ogr_fdw | 1.0 | 1.0 | foreign-data wrapper for GIS d 
pgrouting | 2.4.1 | 2.4.1 | pgRouting Extension 

plpgsql | 1.0 | 1.0 | PL/pgSQL procedural Language 
plv8 | 1.4.10 | 1.4.10 | PL/JavaScript (v8) trusted pro 
postgis | 2.4.0dev | 2.4.0dev | PostGIS geometry, geography, a 
(8 rows) 


如 果 你 想 查 看 一 个 PostgreSQL 服务 实例 中 所 有 database 安装 的 所 有 扩展 包 ， 请 把 上 面 查询 
语句 中 的 WHERE installed_version IS NOT NULL 删 掉 。 


如 果 想 要 了 解 某 个 database 中 已 安装 的 扩展 包 的 更 多 详细 内 容 ， 请 在 psql 中 执行 类 似 以 下 


的 命令 : 
\dx+ fuzzystrmatch 
或 者 执行 以 下 查询 也 可 以 : 


SELECT pg_describe object(D.classid,D.objid,0) AS description 

FROM pg_cataLog.pg_depend AS D INNER JOIN pg_catalog.pg_extension AS E 
ON D.refobjid = E.oid 

WHERE 

D.refclassid = 'pg_catalog.pg_extension'::pg_catalog.regclass AND 
deptype = 'e' AND 








E.extname = 'fuzzystrmatch ' ; 
查询 结果 显示 了 该 扩展 包 中 包含 了 哪些 内 容 : 
description 


function dmetaphone_aLt(text) 

function dmetaphone(text) 

function difference(text ,text) 

function text_soundex(text) 

function soundex(text) 

function metaphone(text,integer) 

function levenshtein less equall(text, text,integer,integer,integer,integer) 
function levenshtein _ less equall(text, text,integer) 

function levenshtein(text, text,integer,integer,integer) 

function levenshtein(text,text) 


扩展 包 中 可 以 包含 各 类 数据 库 对 象 ， 包 括 国 数 、 表 、 数 据 类 型 、 数 据 类 型 转换 器 、 编 程 语 
言 、 运 算 符 ， 等 等 。 但 函数 通常 占 了 其 中 的 大 部 分 。 
2.6.1 扩展 包 的 安装 


将 扩展 包 安 装 到 系统 中 需要 两 个 步骤 : 首先 ， 下 载 安装 包 并 安装 到 数据 库 服务 器 上 ， 
次 ， 将 此 扩展 包 安装 到 目标 database 中 。 
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我 们 在 前 述 两 个 步骤 中 都 使 用 了 “安装 ”这 个 词 ， 但 其 指 代 的 具体 动作 是 不 
一 样 的 ， 当 上 下 文 环境 不 清楚 时 ， 我 们 会 加 以 描述 区 分 。 











以 下 我 们 将 介绍 扩展 包 的 安装 方法 ， 同 时 也 将 介绍 在 不 支持 extension 扩展 包机 制 的 老 版 本 
PostgreSQL 上 安装 contrib 扩展 包 的 方法 。 


1. 步 又 一 : 将 扩展 包 安 装 到 数据 库 服务 器 

这 一 步 的 具体 做 法 会 根据 操作 系统 的 不 同 而 有 所 不 同 。 总 的 来 说 就 是 先 下 载 该 扩展 包 的 安 
装 文件 以 及 所 依赖 的 库 文 件 ， 然 后 将 它们 分 别 复 制 到 操作 系统 的 bn 和 lib 文件 夹 ， 同 时 把 
SQL 脚本 文件 复制 到 share/extension 文件 夹 (9.1 版 及 之 后 版 本 ) 或 者 share/contrib 文件 来 
(9.1 版 之 前 的 版 本 ) 。 这 样 就 为 接 下 来 执行 第 二 步 做 好 了 准备 。 

对 于 较 小 的 扩展 包 来 说 ， 其 所 需 的 很 多 库 文 件 在 PostgreSQL 安装 好 以 后 就 有 了 ， 或 者 没有 
的 话 也 可 以 通过 yum 或 apt get postgresqL-contrib 命令 较 容 易 地 获取 到 。 对 于 通过 以 上 
方式 获取 不 到 的 库 文 件 ， 你 要 么 自行 编译 ， 要 么 找 一 下 别人 已 经 编译 好 的 安装 包 ， 要 么 从 
另 一 台 环 境 完全 相同 的 服务 器 上 把 库 文 件 复制 过 来 。 对 于 PostGIS 这 类 较 大 的 扩展 包 ， 通 
常 可 以 从 你 下 载 PostgreSQL 的 站 点 下 载 到 完整 的 安装 包 。 如 果 想 了 解 当 前 服务 器 上 有 哪些 
扩展 包 可 用 ， 请 执行 以 下 命令 : 


SELECT * FROM pg_available_ extensions; 


2. 步骤 二 : 将 扩展 包 安装 到 指定 的 database 中 

扩展 包机 制 使 得 扩展 特性 的 安装 过 程 更 加 简单 。 使 用 CREATE EXTENSION 命令 即 可 将 扩 
展 包 安装 到 指定 的 database 中 。 相 比 原 来 的 安装 方法 ， 该 新 机 制 有 三 大 主要 优点 : 首 
先 ， 用 户 不 需要 弄 清 楚 扩 展 包 文件 存放 的 具体 路 径 (share/extension) ; 其次， 可 以 通过 
DROP EXTENSION 命令 方便 地 仓 载 扩展 包 ;， 最 后 ， 支 持 查看 当前 已 安装 和 可 安装 的 扩展 包 
列表 。PostgreSQL 安装 包 中 已 经 附带 了 最 常用 的 若干 扩展 包 。 通 过 PostgreSQL Extension 
Network 站 点 可 以 下 载 到 PostgreSQL 安装 包 中 默认 未 附带 的 扩展 包 。GitHub 站 点 上 也 有 很 
多 PostgreSQL 扩展 包 ， 只 需 搜索 “postgresql extension ”关键 字 就 能 找到 。 


以 下 是 安装 fuzzystrmatch 扩展 包 的 命令 : 
CREATE EXTENSION fuzzystrmatch; 


你 仍 可 以 使 用 psql 以 非 交 互 方式 安装 扩展 包 。 先 连接 到 需要 安装 此 扩展 包 的 database， 然 
后 执行 类 似 以 下 命令 行 : 


psqL -p 5432 -d mydb -c "CREATE EXTENSION fuzzystrmatch;" 





























基于 C 语言 的 扩展 包 必须 由 具备 超级 用 户 权 限 的 角色 来 安装 。 大 多 数 扩展 包 
都 是 基于 C 语言 的 。 








强烈 建议 你 创建 专门 的 schema 来 安装 扩展 包 ， 以 确保 扩展 包 数 据 与 业务 数据 隔离 。 建 好 
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schema 后 ， 执 行 以 下 命令 来 将 其 指定 给 待 安装 的 扩展 包 : 
CREATE EXTENSION fuzzystrmatch SCHEMA my_extensions; 


3. 升级 PostgreSQL 版 本 以 支持 新 的 extension 扩 展 包 机 制 

如 果 你 从 PostgreSQL 9.1 或 者 更 早 的 版 本 升级 到 了 9.1 版 或 者 之 后 的 版 本 ， 并 且 也 正确 地 
将 数据 从 老 版 本 导入 到 了 新 版 本 之 中 ， 那 么 之 前 安装 的 那些 contrib 扩展 包 依 然 是 可 以 正 
常 工作 的 。 但 为 了 简化 管理 并 提升 可 维护 性 ， 你 应 该 将 存放 于 contrib 文件 夹 中 的 那些 老 扩 
展 包 升 级 为 新 格式 的 extension 扩展 包 。 这 种 格式 升级 是 完全 可 以 实现 的 ， 尤 其 是 对 那些 
随 PostgreSQL 版 本 附带 的 扩展 包 来 说 更 加 没 问 题 。 不 过 请 注意 ， 这 里 说 的 “升级 ”是 指 从 
contrib 格式 到 extension 格式 的 “格式 升级 ”， 而 不 是 指 扩展 包 本 身 的 “功能 升级 ”。 


例如 ， 如 果 你 之 前 在 一 套 PostgreSQL 9.0 版 的 contrib schema 中 安装 了 tablefunc 扩展 包 
(这 是 一 个 用 于 实现 跨 表 查 询 的 功能 插件 )， 然 后 你 将 该 系统 升级 到 了 9.1 版 ， 那么 可 以 执 
行 以 下 命令 来 升级 此 插件 : 


CREATE EXTENSION tablefunc SCHEMA contrib FROM unpackaged; 


该 命令 会 搜索 contrib schema (假设 你 已 把 所 有 的 扩展 包 都 安装 在 这 里 面 )， 找 到 所 有 属于 
tablefunc 插件 的 成 员 对 象 ， 然 后 把 它们 按照 新 的 extension 扩展 包 模 型 格式 进行 封装 ， 这 
样 该 扩展 包 就 会 出 现在 pg_available_extensions 视图 信息 中 ， 就 好 像 是 全 新 安装 的 一 个 
extension 扩展 包 一 样 。 这 样 就 实现 了 从 contrib 到 extension 的 扩展 包 格 式 升级 。 


该 命令 会 将 contrib schema 中 的 插件 函数 按 extension 模式 进行 封装 格式 升级 ， 函 数 本 身 不 
会 有 任何 改动 ， 但 此 后 该 database 进行 备份 时 不 会 包含 这 些 函 数 ， 因 为 它们 的 身份 已 经 发 
生 了 变化 ， 从 与 别 的 函数 身份 无 法 区 分 的 普通 函数 变 为 extension 扩展 包 中 的 函数 。 


2.6.2 通用 扩展 包 


通用 扩展 包 是 指 那 些 因 功能 比较 基本 和 通用 而 在 PostgreSQL 安装 包 中 默认 附带 的 一 些 
扩展 包 ， 但 它们 不 一 定 会 被 默认 安装 ， 具 体 视 其 功能 而 定 。 有 些 早 期 的 通用 扩展 包 已 被 
PostgreSQL 内 核 接纳 从 而 “ 登 堂 入室 ”成 为 系统 基础 功能 ， 因 此 如 果 你 是 从 较 老 版 本 的 
PostgreSQL 升级 上 来 的 话 ， 可 能 会 发 现 原先 要 通过 安装 扩展 包 才 能 实现 的 功能 现在 已 成 了 
系统 默认 提供 的 功能 。 


1. 比较 常用 的 扩展 包 介 绍 
从 9.1 版 开始 ，PostgreSQL 官方 推荐 开发 人 员 使 用 extension 扩展 包 模 式 来 为 系统 制作 功能 
插件 。 从 仅 包 含 函 数 和 数据 类 型 的 基本 插件 到 包含 了 存储 过 程 语言 支持 (PL)、 索 引 类 型 
以 及 外 部 数据 封装 器 的 高 级 插件 ， 都 可 以 用 extension 扩展 包机 制 来 实现 。 本 节 列 举 了 最 常 
用 (也 有 些 人 称 之 为 “ 必 备 ”) 但 默认 情况 下 PostgreSQL 并 未 安装 的 一 些 扩展 包 。 你 会 发 
现下 面 列 出 的 很 多 扩展 包 在 你 的 PostgreSQL 系统 中 已 经 有 了 ， 具 体 哪些 有 哪些 没有 取决 于 
你 使 用 的 是 哪个 PostgreSQL 发 行 版 ， 不 同 发 行 版 之 间 可 能 会 略 有 差异 。 
btree_gist 
该 扩展 包 实 现 了 基于 B- 树 索引 算法 的 GiST 索引 运算 符 类 ， 适 用 于 B- 树 索引 支持 的 所 
有 数据 类 型 ， 其 具体 效果 与 标准 的 B- 树 索引 类 似 。 更 多 细节 请 参见 6.3.1 节 的 内 容 。 
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btree_gin 
该 扩展 包 实 现 了 基于 B- 树 索引 算法 的 GIN 索引 运算 符 类 ， 适 用 于 B- 树 索引 支持 的 所 有 
数据 类 型 ， 其 具体 效果 与 标准 的 B- 树 索引 类 似 。 更 多 细节 请 参见 6.3.1 市 的 内 容 。 

postgis 

该 扩展 包 将 PostgreSQL 变 成 了 一 个 业界 最 先进 的 空间 数据 库 ， 而 且 其 品质 胜 过 了 所 有 

类 似 的 商业 化 产品 。 如 果 你 需要 处 理 标 准 的 OGC GIS 数据 、 人 口 统 统计 学 数据 地 理 编 

码 数据 、3D 数据 甚至 是 电子 光栅 数据 ， 那 么 postgits 会 是 你 的 必 备 之 选 。 我 们 编写 的 

图 书 PostG7S in Action 中 对 PostGIS 做 了 更 加 详尽 的 介绍 。PostGIS 是 扩展 包 界 的 “ 巨 
无 霸 ”， 它 包含 800 多 个 函数 、 自 定义 数据 类 型 以 及 空间 索引 等 对 象 。PostGIS 如 此 庞 
大 ， 以 至 于 有 人 为 它 开发 二 次 扩展 包 。 有 些 二 次 扩展 包 是 PostGIS 安装 包 自 带 的 ， 当 然 
ee 一 个 是 pgpointcloud， 它 可 以 管理 点 云 数据 
(地 理 信 息 系统 中 海量 的 点 组 成 的 集合 ) ， 另 一 个 是 pgRouting， 它 可 以 进行 网 络 路 径 分 析 。 

fuzzystrmatch 
这 是 一 个 用 于 字符 串 模糊 匹配 的 轻 量 级 扩展 包 ， 包 含 了 诸如 soundex、levenshtein 和 
metaphone 等 算法 。 我 们 在 “Where is Soundex and Other Fuzzy Things” 这 篇 文章 中 介绍 
了 该 扩展 包 的 用 法 。 

hstore 
该 扩展 包 为 PostgreSQL 添加 了 对 键 值 数据 库 的 支持 ， 同 时 也 支持 索引 ， 非 常 适用 于 存 
储 非 结 构 化 数据 。 如 果 你 正在 寻找 一 种 介 于 关系 型 数据 库 和 NoSQL 数据 库 之 间 的 产 
品 ， 可 以 尝试 一 下 hstore。 很 多 原先 适用 hstore 的 场景 已 经 可 以 用 内 置 jsonb 类 型 来 
替代 ， 因 此 这 个 扩展 包 已 经 不 像 以 前 那么 流行 。 

pg_trgm (trigram) 
该 扩展 包 提供 了 另外 一 种 字符 串 模糊 搜索 算法 库 ， 可 与 fuzzystrmatch 配合 使 用 。 该 扩 
展 包 包 含 一 种 运算 符 类 ， 使 得 基于 ILIKE 的 搜索 操作 能 用 上 索引 。 该 扩展 还 能 够 让 形 如 
LIKE '%something%' 的 通配符 查询 或 者 是 形 如 somefield ~ '(foo|bar)' 的 正则 表达 式 
查询 用 上 索引 。 关 于 这 部 分 内 容 ， 在 “Teaching ILIKE and LIKE New Tricks” 这 篇 博文 
中 有 更 深入 的 探讨 。 

dbLink 
该 扩展 包 支 持 从 一 台 PostgreSQL 服务 器 远程 访问 另 一 台 PostgreSQL 服务 器 上 的 数据 。 
在 9.3 版 中 引入 对 外 部 数据 源 的 支持 之 前 ，dbLink 是 唯一 能 够 实现 跨 数据 库 交 互 的 机 
制 。 目 前 该 机 制 一 般 用 于 需要 临时 性 连接 到 外 部 数据 源 或 者 临时 的 即席 查询 场景 ， 特 别 
是 需要 调用 外 部 数据 源 一 侧 的 函数 时 会 有 用 。 在 PostgreSQL 9.6 之 前 ，postgres_ fdw 不 
允许 调用 远 端 PostgreSQL 服务 器 上 除 原生 函数 之 外 的 函数 ， 比 如 远 端 PostgreSQL 安装 
了 扩展 包 后 所 支持 的 新 函数 就 不 能 调用 。 在 PostgreSQL 9.6 中 ， 你 可 以 预先 声明 远 端 服 
务 器 上 已 安装 某 扩 展 包 ， 那 么 就 可 以 在 本 地 调用 远 端 PostgreSQL 服务 器 上 安装 的 扩展 
包 中 的 函数 了 。 


pgcrypto 
该 扩展 包 提 供 了 一 系列 的 加 密 工 具 ， 包 括 使 用 广泛 的 PGP 算法 。 使 用 该 扩展 包 提 供 的 
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功能 来 对 数据 库 中 存储 的 信用 卡号 码 或 其 他 顶级 机 密 信 息 进 行 加 密 是 非常 方便 的 。 在 
“Encrypting Data with pgcrypto” 这 篇 博文 中 我 们 对 其 用 法 进行 了 快速 的 入 门 介绍 。 

2. 经 典 扩展 包 介绍 

此 处 我 们 介绍 几 个 经 典 的 “曾经 的 扩展 包 ”。 之 所 以 称 之 为 “曾经 的 扩展 包 ”， 是 因为 它们 

使 用 非常 广泛 ， 并 因此 被 PostgreSQL 官方 接纳 而 成 为 了 系统 内 核 功 能 的 一 部 分 。 但 在 老 版 

本 的 PostgreSQL 上 ， 它 们 还 是 以 扩展 包 的 形式 存在 。 你 在 实际 工作 中 有 可 能 遇 到 这 些 老 版 

本 ， 所 以 还 是 有 必要 介绍 一 下 这 些 曾 经 的 扩展 包 。 

tsearch 
该 扩展 包 封装 了 一 系列 用 于 强化 全 文 搜索 功能 的 索引 、 运 算 符 、 自 定义 词典 和 国 数 。 目 
前 该 扩展 包 的 功能 已 被 系统 内 核 接纳 并 成 为 PostgreSQL 基础 功能 的 一 部 分 。 如 果 你 使 
用 的 PostgreSQL 版 本 较 老 ， 在 其 上 tsearch 还 是 以 扩展 包 的 形式 存在 ， 那 么 建议 你 升 
级 到 tsearch2 这 个 新 版 本 。 当 然 ， 最 好 的 做 法 其 实 是 将 PostgreSQL 服务 器 软件 升级 到 
新 版 本 ， 因 为 老 版 本 上 的 tsearch 插件 的 兼容 性 支持 随时 可 能 终止 ， 这 会 导致 你 在 老 版 
本 的 PostgreSQL 上 再 也 无 法 享受 到 相关 的 功能 更 新 和 bug 修复 。 

xml 
该 扩展 包 提 供 了 对 XML 数据 类 型 的 支持 以 及 相关 的 函数 和 运算 符 。 为 了 达到 ANSI 
SQL XML 标准 的 要 求 ，PostgreSQL 内 核 接 纳 了 该 插件 包 的 部 分 功能 。 其 余 未 被 纳入 
内 核 的 那 部 分 功能 仍 以 扩展 包 的 形式 存在 ， 不 过 已 改名 为 xmL2。 有 具体 来 说 ， 如 果 你 需 
要 使 用 xLst_process 函数 来 处 理 XSL 模板 数据 ， 那 么 就 需要 安装 xml2 扩展 包 。 另 外 ， 
xml2 扩展 包 中 还 含有 一 些 XPath 函数 。 


2.7 备份 与 恢复 


PostgreSQL 自身 附带 了 三 个 备份 工具 : pg_dump、pg_dumpall 和 pg_basebackup， 三 者 均 位 
于 bin 文件 夹 下 。 

pg_dump 用 于 备份 一 个 指定 的 database， 而 pg_dumpall 可 一 次 性 备份 所 有 database 的 数据 
以 及 系统 全 局 数据 。 由 于 pg_dumpall 需要 能 够 访问 系统 中 的 所 有 database， 因 此 必须 由 具 
备 SUPERUSER 权限 的 角色 来 执行 。pg_basebackup 可 以 针对 所 有 database 实现 系统 级 的 
磁盘 备份 。 

本 节余 下 的 内 容 将 着 重 讨论 pg_dump 和 pg_dumpall。pg_basebackup 是 实现 整个 PostgreSQL 
服务 器 备份 的 最 有 效 工具 。 如 果 你 的 数据 库 足 够 大 ， 比 如 500GB 或 者 更 大 ， 那 么 你 应 该 将 
pg_basebackup 作为 你 备份 策略 中 的 一 个 重要 工具 。 使 用 pg_basebackup 时 需要 打开 一 些 系 
统 参 数 ， 这 些 参数 一 般 是 关闭 的 。 另 外 ， 这 些 参 数 在 配置 复制 功能 时 也 要 用 到 ， 因 此 我 们 
把 这 部 分 留 到 10.2 节 再 讨论 。 

这 两 个 工具 的 大 多 数 命令 行 选 项 都 可 以 有 两 种 写法 : 一 种 是 GNU 风格 〈 两 个 横 杠 连 字符 
后 跟 一 个 单词 ) ， 另 一 种 是 传统 的 单字 母 风 格 (一 个 横 杠 连 字符 后 跟 一 个 字母 )。 这 两 种 写 
法 是 完全 等 价 的 ， 甚 至 在 同一 个 命令 行 中 也 可 以 混用 。 本 节 仅 讨论 一 些 基 本 的 用 法 ， 如 果 
要 了 解 更 多 深入 的 内 容 ， 请 参考 PostgreSQL 官方 手册 中 的 “备份 与 恢复 ”。 
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业界 也 有 一 些 常 用 的 第 三 方 工具 来 实现 PostgreSQL 的 备份 和 恢复 ， 但 本 节 不 会 详细 讨论 。 
两 个 用 得 比较 多 的 开源 工具 是 pgBackRest 和 Barman。 相 比 官方 原生 的 工具 ， 它 们 多 了 定 
时 备份 、 多 服务 器 备份 以 及 快捷 恢复 等 功能 。 

在 学 习 本 节 内 容 时 ， 你 会 发 现 我 们 一 般 会 在 示例 命令 行 中 指明 目标 数据 库 所 在 的 主机 地 址 
和 侦 听 端口 ， 这 是 因为 我 们 一 般 是 在 另外 一 台 机 器 上 通过 执行 pgAgent 定时 任务 的 方式 来 
执行 备份 ， 这 种 情况 下 必须 在 命令 行 写 明 目 标 数据 库 的 地 址 和 侦 听 端口 ， 详 情 将 在 4.5 节 
讨论 ; 或 者 另外 一 种 情况 是 在 同一 台 机 器 上 运行 多 个 PostgreSQL 服务 实例 ， 实 例 间 的 侦 听 
端口 互 不 相同 ， 所 以 命令 行 中 必须 明确 指定 IP 和 端口 。 有 一 个 情况 请 注意 : 如 果 你 的 服务 
被 设置 为 仅 侦 听 localhost， 会 导致 默认 情况 下 只 有 来 自 本 机 的 连接 才 会 被 允许 接 入 ， 这 样 
远 端 机 器 上 的 备份 恢复 工具 会 无 法 连接 。 如 果 备 份 任务 是 直接 在 数据 库 服 务 器 本 机 上 执行 
的 ， 那 么 仅 侦 听 localhsot 是 完全 没 问题 的 。 
pg_dump 和 pg_dumpall 工具 不 支持 在 命令 行 选项 中 设 定 登 录 密 码 ， 因 此 为 了 便于 执行 自动 
任务 ， 你 需要 在 postgres 操作 系统 账户 的 home 文件 夹 下 创建 一 个 密码 文件 .pgpass 来 存 
储 密码 ， 或 者 也 可 以 用 PGPASSWORD 环境 变量 来 设 定 密码 。 


2.7.1 使 用 pg_dump 进 行 有 选择 性 的 备份 

如 果 你 希望 每 天 都 进行 备份 ， 那 么 使 用 pg_dump 比 pg_dumpall 更 合适 ， 因 为 前 者 支持 精确 指 
定 要 备份 的 表 、schema 和 database， 而 后 者 不 支持 。pg_dump 可 以 将 数据 备份 为 SQL 文本 文 
件 格 式 ， 也 支持 备份 为 压缩 格式 、TAR 包 格 式 或 者 目录 格式 。 在 用 pg_restore 进行 数据 恢 
复 时 ， 前 述 三 种 格式 的 备份 文件 都 可 以 实现 并 行 恢复 。 用 pg_dump 进行 备份 时 ， 选 择 目 录 格 
式 可 以 实现 并 行 备 份 ， 因 此 如 果 要 备份 的 数据 库 非 常 大 ， 可 以 考虑 使 用 目录 格式 。 

我 们 认为 pg_dump 是 你 进行 日 常备 份 时 不 可 或 缺 的 工具 ， 因 此 我 们 在 附录 B.1 节 提 供 了 一 
张 完 整 的 pg_dump 帮助 信息 清单 ， 这 样 你 就 可 以 对 其 数量 众多 的 选项 开关 用 法 一 目 了 然 。 
下 面 的 例子 展示 了 一 些 常 见 的 备份 场景 以 及 相应 的 pg_dump 选项 。 这 些 例子 对 于 任何 版 本 
的 PostgreSQL 应 该 都 是 适用 的 。 

份 某 个 database， 备 份 结果 以 自 定 义 压 缩 格式 输出 : 


pg_dump -h localhost -p 5432 -U someuser -F C -b -v -f mydb.backup mydb 


份 某 个 database， 备 份 结果 以 SQL 文本 方式 输出 ， 命 令 中 带 :C 选项， 输出 结果 中 包含 
CREATE DATABASE 语句 














































































































































































































pg_dump -h LocaLhost -p 5432 -U someuser -C -F p -b -v -f mydb.backup mydb 
份 某 个 database 中 所 有 名 称 以 “pay” 开 头 的 表 ， 备 份 结果 以 压缩 格式 输出 : 

pg_dump -h LocaLhost -p 5432 -U someuser -F C -b -v -t *.pay* -f pay.backup mydb 
份 某 个 database 中 hr 和 payroll 这 两 个 schema 中 的 所 有 数据 ， 备 份 结果 以 压缩 格式 输出 : 


pg_dump -h localhost -p 5432 -U someuser -Fc -b -v \ 
-n hr -n payroll -f hr.backup mydb 
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备份 某 个 database 中 除了 public schema 中 的 数据 以 外 的 所 有 数据 ， 备 份 结果 以 压缩 格式 
输出 : 


pg_dump -h localhost -p 5432 -U someuser -F ¢ -b -v -N public \ 
-f all_sch_except_pub.backup mydb 


将 数据 备份 为 SQL 文本 文件 ， 且 生成 的 INSERT 语句 是 带 有 字段 名 列表 的 标准 格式 ， 该 文 
件 可 用 于 将 数据 导入 到 低 于 当前 版 本 的 PostgreSQL 或 者 其 他 支持 SQL 的 非 PostgreSQL 数 
据 库 中 (之 所 以 能 够 实现 这 种 数据 移植 过 程 ， 是 因为 标准 的 SQL 文本 可 在 任何 支持 SQL 
标准 的 数据 库 中 执行 ) : 

pg_dump -h localhost -p 5432 -U someuser -F p --column-inserts \ 

-f select tables.backup mydb 
































如 果 输 出 文件 路 径 中 含 空格 或 者 其 他 可 能 影响 命令 行 正常 处 理 的 字符 ， 请 在 
路 径 两 侧 加 上 双 引 号 ， 比 如 : "/path with spaces/mydb.backup"。 请 注意 ， 
这 在 PostgreSQL 中 是 一 个 通用 的 原则 ， 即 当 你 不 确定 某 段 文本 是 否 能 正常 
处 理 时 ， 都 可 以 加 双 引 号 。 

















从 PostgreSQL 9.1 版 开始 支持 目录 格式 。 使 用 该 格式 会 将 每 个 表 备 份 为 某 个 文件 夹 下 的 一 
个 单独 的 文件 ， 这 样 就 解决 了 以 其 他 备份 格式 备份 时 可 能 存在 的 单个 文件 大 小 超出 操作 系 
统 限 制 的 问题 。pg_dump 工具 所 支持 的 各 种 备份 格式 中 ， 只 有 使 用 目录 格式 时 会 生成 多 个 
文件 ， 有 具体 语法 参见 示例 2-10。 备 份 时 会 先 创建 一 个 新 目录 ， 然 后 为 每 个 表 生 成 一 个 gzip 
格式 的 压缩 文件 ， 另 外 目录 下 还 会 生成 一 个 描述 所 有 备份 对 象 之 间 层 级 关系 的 文件 。 如 果 
备份 开始 时 发 现 指定 的 目录 已 存在 ， 那 么 该 命令 会 报错 并 退出 。 
示例 2-10 目录 格式 备份 

pg_dump -h localhost -p 5432 -U someuser -F d -f /somepath/a_directory mydb 
从 9.3 版 开始 支持 并 行 备 份 选项 ，--jobs 或-j， 后 面 设置 并 行 度数 值 。 例 如 将 其 设 定 为 
--jobs=3 (-j 3)， 则 后 台 会 有 三 个 线程 并 行 执行 当前 备份 任务 。 此 选项 只 有 在 按 目录 格式 
进行 备份 时 才 会 生效 ， 因 为 前 面 已 经 提 到 过 ， 只 有 选择 目录 格式 时 才能 并 行 生成 多 个 备份 
文件 。 每 个 写 线程 只 负责 写 一 个 单独 的 文件 ， 因 此 一 定 是 输出 结果 为 多 个 独立 的 文件 时 才 
可 以 并 行 。 示 例 2-11 演示 了 其 用 法 。 
示例 2-11 目录 格式 并 行 备份 


pg_dump -h localhost -p 5432 -U someuser -j 3 -Fd -f /somepath/a_directory mydb 


2.7.2 ”使 用 pg_dumpall 进 行 全 局 备份 

pg_dumpall 工具 可 以 将 当前 PostgreSQL 服务 实例 中 所 有 database 的 数据 都 导出 为 SQL 文 
本 (请 注意 : pg_dumpall 不 支持 导出 SQL 文本 以 外 的 其 他 格式 )。 可 以 看 出 ， 这 是 一 种 便 
于 理解 的 明文 备份 格式 ， 备 份 结果 也 包含 了 表 空 间 定义 和 角色 等 全 局 对 象 。 要 了 解 该 命令 
支持 的 所 有 选项 ， 请 参考 附录 B.2 节 。 


建议 你 每 天 都 对 角色 和 表 空 间 定 义 等 全 局 对 象 进 行 备 份 ， 但 不 建议 每 天 都 使 用 pg_dumpall 
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来 备份 所 有 database 的 数据 ， 使 用 pg_dump 来 分 别 备份 每 个 database 或 者 使 用 pg_basebackup 
来 备份 整个 PostgreSQL 实例 的 全 部 数据 是 更 好 的 选择 。pg_dumpall 仅 支 持 导 出 为 SQL 文 
本 格式 ， 而 使 用 这 种 庞大 的 SQL 文本 备份 来 进行 全 库 级 别 的 数据 恢复 是 极其 耗 时 的 。 将 
pg_basebackup 与 流 复 制 机 制 连用 是 实现 PostgreSQL 系统 高 可 用 的 最 快 方法 。 

以 下 命令 可 实现 仅 备份 角色 和 表 空 间 定 义 等 爹 局 对 象 : 


pg_dumpall -h localhost -U postgres --port=5432 -f myglobals.sgl --globals-only 


如 果 仅 需 备 份 角色 定义 而 无 须 备 份 表 空 间 ， 那 么 使 用 如 下 命令 : 


pg_dumpall -h localhost -U postgres --port=5432 -f myroles.sgql --roles-only 


2.7.3 数据 恢复 

PostgreSQL 可 以 使 用 以 下 两 种 方法 来 恢复 pg_dump 和 pg_dumpall 备份 的 数据 : 

。 使 用 psql 来 恢复 pg_dump 或 者 pg_dumpall 工具 生成 的 SQL 文本 格式 的 数据 备份 ; 

。 使 用 pg_restore 工具 来 恢复 由 pg_dump 工具 生成 的 压缩 格式 、TAR 包 格 式 或 者 目录 格 
式 备份 。 


1. 使 用 psql 恢 复 SQL 文 本 格式 的 数据 备份 
所 谓 的 SQL 文本 格式 的 数据 备份 其 实 就 是 一 个 包含 SQL 脚本 的 文本 文件 。 这 种 备份 格式 
使 用 起 来 最 不 方便 ， 却 是 最 通用 的 一 种 。 恢 复 时 需要 将 此 SQL 脚本 全 部 执行 一 遍 。 你 无 法 
选择 性 地 仅 恢 复 部 分 数据 ， 除 非 你 手工 编辑 此 文件 。 以 下 示例 都 是 在 操作 系统 命令 行 界面 
执行 ， 过 程 中 可 能 需要 在 psql 界面 上 输入 密码 。 
恢复 一 个 SQL 备份 文件 并 忽略 过 程 中 可 能 发 生 的 所 有 错误 : 

psql -U postgres -f myglobals.sgl 
恢复 一 个 SQL 备份 文件 ， 如 遇 任 何 错误 则 立即 停止 恢复 


psql -U postgres --set ON_ERROR_STOP=on -f myglobals.sgl 


将 SQL 文本 中 的 数据 恢复 到 某 个 指定 的 database: 


psql -U postgres -d mydb -f select objects.sgl 


2. 使 用 pg_restore 进 行 恢复 

如 果 你 是 使 用 pg_dump 进行 的 备份 ， 并 且 选 择 的 输出 格式 为 TAR、 压 缩 格 式 或 者 目录 格 

式 ， 输 出 结果 都 是 二 进 制 文件 ， 那 么 必须 使 用 pg_restore 工具 来 进行 恢复 。pg_restore 支 

持 的 选项 之 多 令 人 有 眼花 练 乱 ， 远 远 超 过 我 们 所 使 用 过 的 其 他 任何 数据 库 中 提供 的 恢复 工 

具 。 以 下 介绍 一 些 该 工具 的 特别 功能 。 

。 支持 并 行 恢复 ， 使 用 -j (或 者 是 效果 相同 的 --jobs=) 选项 可 以 指定 并 行 恢复 的 线程 数 。 
多 个 恢复 线程 可 以 并 行 处 理 ， 每 个 线程 处 理 一 张 表 。 该 模式 可 以 显著 提高 恢复 速度 。 

。 你 可 以 使 用 pg_restore 扫描 备份 文件 来 生成 一 张 备份 内 容 列表 ， 通 过 该 列表 可 以 确认 

备份 中 包含 了 哪些 内 容 。 你 还 可 以 通过 编辑 该 内 容 列 表 来 控制 恢复 哪些 内 容 。 
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。 pg_restore 支持 选择 性 地 仅 备份 部 分 对 象 以 节省 备份 时 间 ， 不 管 是 针对 整个 database 的 
备份 还 是 针对 部 分 对 象 的 备份 ， 都 可 以 使 用 该 特性 。 如 果 你 仅 需 恢复 单 张 表 ， 那 么 可 以 
用 这 个 方法 。 
。 pg_restore 的 大 部 分 功能 是 后 向 兼容 的 ， 即 支持 将 老 版 本 PostgreSQL 生成 的 备份 数据 
恢复 到 新 版 本 的 PostgreSQL 中 。 

若 想 了 解 pg_restore 命令 所 支持 的 全 部 选项 ， 请 参考 附录 B.3 市 。 
在 使 用 pg_restore 执行 恢复 动作 之 前 ， 请 先 创建 目标 数据 库 : 

CREATE DATABASE mydb; 
然后 执行 恢复 : 

pg_restore --dbname=mydb --jobs=4 --verbose mydb.backup 
如 果 备 份 和 恢复 时 使 用 的 database 同名 ， 则 可 以 通过 加 --create 选项 省 去 单独 建 库 的 过 
程 9》 命令 如 下 2 

pg_restore --dbname=postgres --create --jobs=4 --verbose mydb.backup 
如 果 指 定 了 --create 选项 ， 那 么 恢复 出 来 的 数据 库 名 就 会 默认 采用 备份 时 的 数据 库 名 ， 不 
允许 改名 。 如 果 还 同时 指定 了 --dbname 选项 ， 那 么 此 时 连接 的 数据 库 名 一 定 不 能 是 待 恢复 
的 数据 库 名 ， 因 为 恢复 数据 库 之 前 必然 要 建 数据 库 ， 而 建 数据 库 之 前 必然 要 先 连 到 某 个 已 
存在 的 数据 库 ，- -dbname 选项 指定 的 就 是 建立 被 恢复 的 数据 库 之 前 先 连 到 哪个 数据 库 ， 所 
以 必然 不 能 与 待 恢复 的 数据 库 重 名 ， 我 们 一 般 指定 为 先 连 到 postgres 数据 库 。 
正常 情况 下 ， 数 据 恢 复 时 不 会 重建 目标 database 中 已 经 存在 的 对 象 。 如 果 你 的 目标 
database 和 其 中 的 各 类 对 象 均 已 存在 ， 并 且 还 有 一 些 数据 在 里 面 ， 你 只 是 想 用 备份 中 的 数 
据 来 替代 现 有 database 中 的 数据 ， 那 么 执行 pg_resotre 时 使 用 --clean 选项 即 可 达到 目 
标 。 该 选项 的 效果 是 先 把 目标 database 中 的 对 象 删除 掉 ， 然 后 在 恢复 过 程 中 一 一 重建 。 
如 果 针 对 现存 的 一 个 database 执行 恢复 ， 其 内 容 会 被 备份 文件 中 的 内 容 替 
代 。 因 此 这 种 情况 下 需要 特别 注意 : 千 万 不 要 选 错 了 备份 文件 或 者 指定 了 错 
误 的 目标 database。 







































































9.2 版 或 更 新 版 本 的 pg_restore 支持 --section 选项 ， 加 上 该 选项 后 可 以 实现 仅 恢 复 表 结 
构 而 不 恢复 表 数 据 。 当 和 希望 创建 模板 数据 库 时 可 以 用 这 个 方法 ， 因 为 模板 数据 库 一 般 不 需 
要 带 数 据 。 具 体 做 法 是 先 创建 目标 数据 库 : 


CREATE DATABASE mydb2; 


然后 使 用 pg_restore: 


pg_restore --dbname=mydb2 --section=pre-data --jobs=4 mydb.backup 


2.8 基于 表 空 间 机 制 进行 存储 管理 


PostgreSQL 使 用 “ 表 空 间 ” 这 一 概念 来 将 逻辑 存储 空间 映射 到 磁盘 上 的 物理 存储 空间 。 
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PostgreSQL 在 安装 阶段 会 自动 生成 两 个 表 空 间 : 一 个 是 pg_default， 用 于 存储 所 有 的 用 户 
级 数据 ， 另 一 个 是 pg_global， 用 于 存储 所 有 的 系统 级 数据 。 这 两 个 表 空 间 就 位 于 默认 的 
数据 文件 夹 下 。 你 可 以 不 受 限 地 创建 表 空 间 并 将 其 物理 存储 位 置 设 定 到 任何 一 块 物理 磁盘 
上 。 你 也 可 以 为 database 设 定 默 认 表 空间 ， 这 样 该 database 中 创建 的 任何 新 对 象 都 会 存储 
到 此 表 空 间 上 。 你 也 可 以 将 现存 的 数据 库 对 象 迁移 到 新 的 表 空 间 中 。 


2.8.1 表 空 间 的 创建 


创建 表 空间 需要 先 为 其 取 一 个 逻辑 名 称 并 指定 茶 个 物理 文件 夹 作 为 其 存储 位 置 ， 注 意 要 确 
保 postgres 操作 系统 账户 对 此 文件 夹 有 完全 的 访问 权限 。 如 果 你 目前 使 用 的 是 Windows 
服务 器 ， 请 使 用 如 下 命令 行 ( 注 意 使 用 Unix 风格 的 斜 杠 作为 路 径 分 隔 符 ) : 


CREATE TABLESPACE secondary LOCATION ‘'C:/pgdata94 secondary'; 
对 于 基于 Unix 的 系统 来 说 ， 必 须 先 创建 文件 夹 或 者 定义 一 个 fstab 位 置 ， 然 后 执行 以 下 命令 : 


CREATE TABLESPACE secondary LOCATION '/usr/data/pgdata94 secondary'; 


2.8.2 ”在 表 空 间 之 间 迁 移 对 和 象 
你 可 以 将 数据 库 中 的 对 象 在 表 空 间 之 间 随 意 迁 移 。 如 果 希 望 将 一 个 database 的 所 有 对 象 都 
移动 到 另 一 个 表 空间 中 ， 可 以 执行 以 下 命令 : 

ALTER DATABASE mydb SET TABLESPACE secondary; 
如 果 只 希望 移动 一 张 表 ， 命 令 如 下 : 

ALTER TABLE mytable SET TABLESPACE secondary; 
PostgreSQL 9.4 中 引入 了 一 个 新 功能 : 一 次 性 把 一 个 表 空 间 的 多 个 对 象 迁 移 到 另 一 个 表 空 
间 。 如 果 命 令 执行 者 是 超级 用 户 ， 那 么 源 表 空 间 所 有 的 对 象 都 会 被 迁移 过 去 ， 否则 仅 会 迁 
移 执行 者 所 拥有 的 对 象 。 
将 pg_default 默认 表 空 间 中 的 所 有 对 象 迁移 到 secondary 表 空 间 ， 所 需 的 命令 行 如 下 : 


ALTER TABLESPACE pg_defauLt MOVE ALL TO secondary; 


在 迁移 过 程 中 所 涉及 的 database 和 表 会 被 锁定 。 


区 Xp 一 全 
2.9 ”禁止 的 行为 
我 们 作为 第 一 见证 人 见证 并 处 理 过 很 多 PostgreSQL 故障 ， 因 此 在 本 章 的 最 后 一 节 中 ， 我 们 
认为 有 必要 逐条 列 出 那些 最 常见 的 错误 。 
对 于 初学 者 来 说 ， 如 果 你 搞 不 清 到 底 哪里 出 了 问题 ， 那 么 请 首先 查看 系统 日 志 ， 从 中 可 以 
找到 解决 问题 的 线索 。 日 志文 件 位 于 数据 文件 夹 的 根 目录 或 者 其 中 的 pg_log 子 文件 夹 下 。 
也 有 可 能 系统 在 记 下 日 志 之 前 即 已 月 涡 ， 那 么 显然 这 种 情况 下 查 日 志 古 没 用 的 。 如 果 你 的 
PostgreSQL 服务 启动 失败 ， 请 尝试 执行 以 下 操作 系统 命令 。 


path/to/your/bin/pg_ctl -D your_postgresgql_data folder 
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2.9.1 切记 不 要 删除 PostgreSQL 系 统 文件 
你 可 能 觉得 这 是 废话 ， 但 当 磁 盘 空 间 不 够 的 时 候 有 些 人 就 会 伐 手 慌 脚 地 从 PostgreSQL 的 数 
据 文件 夹 下 删除 文件 ， 因 为 它 占 用 的 空间 实在 是 太 大 了 。 出 现 这 种 问题 的 部 分 原因 是 有 些 
文件 夹 的 名 称 的 确 很 容易 令 人 误解 ， 比 如 : pg_log、pg_xlog 和 pg_clog。 这 里 面 的 确 有 些 
文件 是 可 以 安全 删除 的 ， 但 你 需要 准确 地 知道 哪些 能 删 哪些 不 能 删 ， 否 则 很 容易 导致 数据 
库 被 破坏 。 


pg_log 文件 夹 一 般 在 data 文件 夹 下 ， 其 体积 可 能 增长 得 很 快 ， 尤 其 是 当 打 开 了 日 志 开关 的 
时 候 。 这 个 文件 夹 下 的 文件 任何 时 候 都 可 以 安全 删除 ， 事 实 上 很 多 人 会 设置 一 个 定时 任务 
来 定期 清除 这 些 日 志文 件 。 


除了 pg_xlog 文件 夹 下 的 文件 可 以 有 条 件 地 删除 外 ， 其 他 PostgreSQL 系统 文件 夹 中 的 文件 
都 不 能 删 ， 即 使 有 的 文件 夹 名 称 中 带 有 log 字样 因而 看 起 来 像 是 某 种 日 志 ， 也 绝对 不 能 删 ， 
比如 pg_clog 文件 夹 中 存储 的 是 活跃 事务 提交 日 志 ， 除 非 你 想 删 库 跑 路 ， 否 则 千 万 不 要 碰 。 


pg_xlog 文件 夹 用 于 存储 事务 日 志 。 我 们 见 过 有 的 系统 中 会 在 pg_xlog 文件 夹 下 建 一 个 子 文 
件 夹 archive， 专 门 用 于 存放 归档 的 事务 日 志 。 一 般 来 说 ， 你 的 系统 总 会 需要 创建 一 个 专门 的 
文件 夹 ( 该 文件 夹 不 一 定 要 放 在 pg_xlog 下 ) 用 于 日 志 归 档 ， 因 为 如 果 这 是 一 个 同步 复制 环 
境 ， 那 么 需要 持续 地 进行 事务 日 志 归 档 ， 需 要 归档 文件 夹 的 另 一 个 理由 是 得 把 这 些 日 志 存 下 
来 以 备 不 时 之 需 ， 因 为 我 们 有 可 能 需要 将 系统 数据 恢复 到 过 去 的 某 个 时 间 点 。 将 pg_xlog 文 
件 夹 下 的 所 有 文件 都 删除 会 导致 PostgreSQL 后 台 进 程 崩溃 。 但 仅 删 除 归 档 文件 夹 下 的 日 志 
却 没 这 么 严重 ， 最 多 会 导致 无 法 恢复 到 过 去 的 某 个 时 点 ,或 者 是 在 同步 环境 下 可 能 导致 从 属 
服务 器 无 法 进行 数据 同步 ， 因 为 还 未 来 得 及 同步 的 一 些 日 志文 件 可 能 已 被 删 掉 了 。 如 果 以 
上 场景 在 你 的 系统 中 都 不 涉及 ， 那 么 可 以 放心 地 删除 归档 文件 夹 下 的 日 志文 件 。 

要 当心 革 些 过 于 “尽责 ”的 杀毒 软件 ， 特 别 是 在 Windows 上 。 我 们 曾经 遇 到 过 杀毒 软件 把 
很 重要 的 PostgreSQL 可 执行 文件 给 删 掉 的 案例 。 如 果 在 Windows 环境 下 发 现 PostgreSQL 无 
法 启动 ， 记 得 首先 查看 一 下 事件 查看 器 (event viewer) 的 记录 ， 其 中 可 能 存在 有 用 的 线索 。 


























































































































在 PostgreSQL 10 中 ，pg_xlog 目录 被 改名 为 pg_wal，pg_clog 被 改名 为 pg_xact， 
以 防止 用 户 认为 这 些 目录 中 放 的 都 是 日 志 ， 想 删 就 删 而 不 会 造成 任何 后 果 。 








2.9.2 不 要 把 操作 系统 管理 员 权 限 授予 PostgreSQL 的 系统 
账号 

很 多 人 可 能 会 误 认为 postgres 这 个 操作 系统 账号 必须 拥有 操作 系统 的 管理 员 权限 。 事 实 

上 ,在 有 的 PostgreSQL 版 本 上 ， 如 果 给 予 了 postgres 账号 管理 员 权 限 ， 很 有 可 能 导致 该 

操作 系统 启动 失败 。 

postgres 账号 应 该 就 是 一 个 普通 用 户 账号 ， 只 要 能 够 访问 data 文件 夹 以 及 其 他 表 空 间 文件 

夹 即 可 。 大 多 数 PostgreSQL 安装 包 会 自动 为 postgres 账号 设 定 够 用 的 权限 ， 请 不 要 画 蛇 

添 足 。 在 SQL 注入 攻击 中 ， 那 些 不 必要 的 权限 会 为 攻击 者 们 提供 可 乘 之 机 。 
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有 些 情况 下 ， 的 确 是 有 必要 把 data 文件 夹 以 外 的 某 些 文件 夹 或 者 可 执行 程序 的 “改写 / 删 
除 / 读 取 ” 权 限 授予 postgres 帐号。 比如， 当 需 要 设置 一 个 定时 任务 来 执行 批 处 理 任务 或 
者 访问 文件 型 FPDW 时 就 需要 这 么 干 。 针 对 这 种 情况 ， 我 们 也 建议 你 仅仅 授予 postgres 账 
号 最 小 的 必要 权限 ， 而 不 应 该 为 了 图 省 事 而 直接 授予 其 最 高 权限 。 


2.9.3 不 要 把 shared_buffers 缓 存 区 设置 得 过 大 


禁止 将 shared_buffers 设置 得 和 系统 当前 内 存 总 容量 一 样 大 ， 否 则 很 可 能 会 导致 操作 系统 
崩溃 或 者 是 启动 失败 。 在 32 位 Windows 系统 上 ， 该 设置 如 果 超 过 512MB 就 可 能 导致 系 
统 出 问题 。 在 64 位 Windows 上 ， 该 限制 可 以 放宽 到 1GB 或 者 更 大 一 些 也 没 问题 。 在 有 些 
Linux 系统 上 ， 不 能 将 shared_buffers 设置 得 大 于 SHMMAX 变量 ， 而 一 般 来 说 SHMMAX 的 值 
是 比较 小 的 ， 所 以 这 就 给 shared_buffers 的 设置 带 来 了 一 些 限 制 。 


PostgreSQL 9.3 修改 了 内 核对 于 内 存 的 使 用 方法 ， 因 此 之 前 版 本 中 那些 因 内 核 限 制 而 导致 
的 问题 从 该 版 本 开始 不 复 存在 。 官 方 手册 中 “内 核资 源 管理 ”一 市 介绍 了 更 多 关于 这 方面 
的 细节 。 


2.9.4 不 要 将 PostgreSQL 服 务 器 的 侦 听 端口 设 为 一 个 已 被 
其 他 程序 占用 的 端口 


如 果 启 动 PostgreSQL 时 系统 发 现 侦 听 端 口 已 被 占用 ， 那 么 会 在 pg_log 中 记录 类 似 这 样 的 
错误 日 志 : make sure PostgreSQL is not already running。 以 下 是 可 能 导致 该 问题 的 常见 
原因 。 


。 postgres 服务 实例 已 经 启动 好 了 ， 而 你 正 试图 再 启动 一 遍 。 

。 PostgreSQL 服务 侦 听 端口 已 被 其 他 程序 占用 。 

。 postgres 服务 之 前 发 生 过 异常 关闭 或 者 崩溃 ， 在 data 文件 夹 下 遗留 了 一 个 postgresql.pid 
文件 。 请 直接 删除 该 文件 并 再 次 尝试 启动 。 

。 有 一 个 孤立 的 PostgreSQL 进程 还 在 运行 。 如 果 前 述 方法 都 试 过 了 但 问题 仍 未 解决 ， 请 
终止 所 有 还 在 运行 的 PostgreSQL 进程 ， 然 后 再 次 尝试 启动 。 
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第 3 章 
psql 工 具 





psql 是 PostgreSQL 自 带 的 一 个 不 可 或 缺 的 命令 行 工具 ， 用 途 广泛 ， 除 了 执行 SQL 这 个 基 
本 功能 外 ， 还 可 用 于 执行 脚本 、 导 入 导出 数据 、 恢 复 表 数 据 以 及 执行 其 他 数据 库 管 理 任 
务 ， 它 其 至 还 可 以 作为 一 个 简单 的 报表 生成 器 来 使 用 。 如 果 你 只 能 以 无 图 形 界 面 的 命令 行 
式 让 ， 那 么 psql 就 是 你 访问 PostgreSQL 的 唯一 选择 。 如 果 你 符合 前 述 

青 况 ， 那 么 你 就 得 得 熟悉 psql 的 众多 命令 和 选项 。 在 学 习 本 章 时 ， 建 议 你 将 附录 B.4 节 中 提 
供 的 各 人 全 售 外间 洒 ， 放 在 也 < 二 浊 


3.1 环境 变量 


在 设置 PGHOST、PGPORT 和 PGUSER 等 环境 变量 后 ， 在 调用 psql 命令 行 时 就 不 用 显 式 地 指定 
主机 、 A ee 量 设 定 的 值 ， 这 一 点 跟 PostgreSQL 自 带 的 其 
他 命令 行 工具 是 一 样 的 。 为 避免 每 次 登录 时 都 输入 密码 ， 你 也 可 以 用 PGPASSWORD 这 个 环境 
变量 来 设置 登录 密码 。 如 果 和 希望 以 更 安全 的 方式 处 理 登 录 密 码 ， 请 使 用 密码 文件 ， 相 关内 
容 请 参见 官方 手册 中 “密码 文件 ”一 节 的 介绍 。 从 PostgreSQL 9.2 版 开始 ，psql 支持 以 下 
两 个 新 的 环境 变量 。 
PSQL_HISTORY 
该 变量 用 于 设置 psql 历史 日 志文 件 名 ， 该 日 志 中 记录 了 近期 通过 psql 执行 过 的 所 有 命 
令 行 ， 其 默认 值 为 ~/.psql_history。 
PSQLRC 
该 变量 用 于 设置 用 户 自 定 义 的 配置 文件 的 路 径 和 文件 名 。 你 可 以 自行 决定 是 否 使 用 该 特 
性 。 用 户 可 以 将 常用 的 设置 项 统一 集中 存放 到 自 定义 配置 文件 里 ， 然 后 psql 启动 时 会 
先 读 取 这 个 文件 再 加 载 默认 配置 ， 这 个 文件 中 的 配置 会 覆盖 默认 配置 。 
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如 果 你 既 未 设 定 相 应 的 环境 变量 ， 也 未 在 命令 行 中 指定 相关 参数 ， 那 么 psql 会 使 用 系统 默 
认 值 。 


如 果 你 使 用 pgAdmin3 工具 连接 到 了 某 个 database， 那 么 可 以 通过 其 工具 栏 
上 的 “插件 ”菜单 项 来 直接 打开 psql， 这 个 新 打开 的 psql 使 用 的 参数 就 是 
pgAdmin 配置 的 参数 。 


























3.2 ”psql 的 两 种 操作 模式 : 交互 模式 与 非 交 互 模式 


直接 在 操作 系统 的 命令 行 界面 上 键入 psql 并 按 回 车 ， 从 操作 系统 提示 符 切换 到 psql 提示 
符 后 就 表示 已 经 进入 了 psql 的 交互 模式 界面 。 你 现在 就 可 以 执行 命令 了 。 对 于 SQL 语句 
来 说 ， 记 得 要 输入 分 号 作为 命令 结束 标记 ， 要 是 不 输入 就 直接 按 回 车 的 话 ，psql 会 认为 命 
令 还 未 输入 完成 ， 会 在 换行 后 等 待 继 续 输入 。 

在 psql 界面 上 键入 \? 会 列 出 交互 模式 下 支持 的 所 有 命令 。 为 了 方便 读者 ， 我 们 将 这 些 命 
令 列 表 放 在 了 附录 B 中 ， 并 高 亮 显 示 最 新 版 本 中 添加 的 条 目 ， 具 体 请 参见 附录 B.4 市 。 如 
果 在 psql 界面 上 键入 \h， 后 跟 命令 关键 字 ， 则 会 打印 出 该 命令 在 PostgreSQL 官方 手册 中 
相应 的 语法 帮助 信息 。 


如 果 和 希望 顺序 执行 一 系列 命令 ， 我 们 建议 把 这 些 命令 写成 一 个 脚本 文件 ， 然 后 使 用 psql 以 
非 交 互 模式 执行 该 脚本 。 在 操作 系统 的 命令 提示 符 下 输入 psqt 后 带 脚 本 文件 名 即 可 执行 
该 脚本 。 脚 本 中 可 以 含有 任意 数量 的 SQL 和 psql 命令 。 除 执行 脚本 外 ， 非 交互 模式 还 支 
持 直接 执行 一 条 或 多 条 SQL 语句 ， 不 过 语句 两 侧 需 要 加 上 双 引 号 。 可 以 看 出 ， 该 模式 特别 
适用 于 需要 执行 自动 化 任务 的 场景 。 只 需 将 任务 内 容 写 人 脚本 文件 ， 然 后 用 某 种 定时 任务 
工具 来 设置 好 定时 执行 即 可 。 定 时 任务 工具 可 以 采用 pgAgent， 在 Linux/Unix 下 可 以 使 用 
crontab， 在 Windows 下 可 以 使 用 定时 任务 规划 器 。 


由 于 非 交 互 模式 下 绝 大 多 数 操作 逻辑 都 由 脚本 实现 ， 因 此 命令 行 需要 提供 的 选项 很 少 。 如 
需 了 解 非 交 互 模式 下 psql 的 选项 ， 请 参考 附录 B.5 市 。 要 在 非 交 互 模式 下 执行 脚本 文件 ， 
只 需 使 用 -f 选项 即 可 : 

psqL -f some_script_File 
要 在 非 交 互 模式 下 执行 SQL 语句 ， 只 需 使 用 -c 选项 即 可 。 如 果 要 一 次 执行 多 个 语句 ， 话 
句 之 间 请 用 分 号 分 隔 ; 

psql -d postgresqL_book -c "DROP TABLE TF EXISTS dross; CREATE SCHEMA staging;" 
在 脚本 中 也 可 以 使 用 交互 式 命令 。 示 例 3-1 是 一 个 名 为 build_stage.psql 的 脚本 的 内 容 ， 其 
中 会 创建 一 张 名 为 staging.factfinder_import 的 表 ， 该 表 后 续 会 在 示例 3-10 中 用 到 。 脚 
本 中 先生 成 了 一 个 CREATE TABLE 命令 ， 然 后 将 这 个 命令 写 人 了 create_script.sql 文件 ， 最 后 
执行 了 刚刚 生成 的 create_script.sql 文件 。 
示例 3-1 带 psql 交互 式 命令 的 脚本 


\a0 
\t 
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\g create_script.sql 
SELECT 
'CREATE TABLE staging.factfinder import ( 
geo_id varchar(255), geo_id2 varchar(255), geo_display varchar(255),' || 
array_to_string(array_agg('s' || 


lpad(i::text,2,'0') || ' varchar(255),s' || 
lpad(i::text,2,'0') || '_perc varchar(255)'),',') || 
Es 
FROM generate_series(1,51) As i; 


\o @ 
ML create_script.sqL ©@ 

@ 我 们 希望 该 脚本 执行 后 输出 的 结果 是 能 直接 运行 的 SQL 语句 ， 因 此 需要 用 \t (或 者 
--tuples-only) 选项 来 忽略 标题 栏 的 输出 ， 同 时 使 用 \a 选项 关闭 对 齐 模式 以 防止 psql 
为 对 齐 输出 结果 而 自动 加 上 换行 符 。 使 用 \g 让 所 有 查询 内 容 都 输出 到 指定 文件 。 

@ 使 用 不 带 参数 的 \o 命令 来 停止 查询 结果 重 定向 到 外 部 文件 。 

@ 使 用 \i 加 脚本 名 create_script.sql 来 执行 生成 的 脚本 。\i 的 效果 等 同 于 非 交 互 模式 下 的 
-f 选项 。 


要 执行 示例 3-1， 在 操作 系统 命令 行 界面 下 输入 以 下 命令 行 即 可 : 
psql -f build_stage.psql -d postgresqL_book 


示例 3-1 中 借 览 了 “How to Create an N-column Table” 这 篇 博文 中 所 介绍 的 方法 来 创建 表 。 
这 篇 文章 中 介绍 的 方法 无 须 借助 中 间 文 件 ， 而 是 采用 了 从 PostgreSQL 9.0 版 开始 支持 的 D0 
命令 来 执行 自动 化 建 表 。 


3.3 定制 psql 操 作 环 境 


如 果 你 的 工作 需要 整 天 与 psql 打交道 ， 那 么 可 以 对 psql 操作 环境 进行 定制 以 使 其 更 好 地 符 
合 自 己 的 使 用 习惯 。psql 在 启动 阶段 会 搜索 一 个 名 为 psqlrc 的 配置 文件 ， 如 果 找 到 则 会 顺 
序 执行 其 中 的 配置 动作 ， 这 些 配置 决定 了 psql 的 一 些 行为 模式 。 


在 Linux/Unix 环境 中 ， 该 文件 一 般 会 被 命名 为 .psqlrc 并 放置 在 postgres 用 户 的 home 目录 
下 。 在 Windows 上 ， 该 文件 叫 作 psqlrc.conf 并 被 放置 于 %APPDATA%\postgresql 文件 夹 
下 ， 一 般 来 说 就 是 c:\Users\username\AppData\Roaming\postgresql 文件 夹 。PostgreSQL 安 
装 完成 后 找 不 到 此 文件 是 正常 的 ， 因 为 该 文件 一 般 需 手动 创建 。 该 文件 中 的 设置 项 会 覆盖 
psql 的 默认 值 。 如 需 了 解 更 多 关于 此 配置 文件 的 信息 ， 请 参见 官方 手册 中 “psql 参考 手册 ” 
一 市 的 内 容 。 


示例 3-2 中 展示 了 psqlrc 文件 的 内 容 ， 你 可 以 在 其 中 添加 任何 psql 命令 以 在 启动 时 执行 。 


示例 3-2 ”psqlrc 文件 内 容 
\pset null 'NULL' 
\encoding Latin1 
\set PROMPT1 '%nN@%M:%>%x %/# " 
\pset pager always 
\timing on 
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\set qstats92 ' 
SELECT usename, datname, left(query,100) || ''...'' As query 
FROM pg_stat_activity WHERE state != ''idle'' ;} 


psqlrc 文件 中 set 命令 后 跟 的 操作 内 容 不 允许 分 为 多 行书 写 。 上 文 显示 为 两 
行 仅仅 是 因为 该 语句 较 长 导致 印刷 时 放 不 下 ， 所 以 必须 分 成 两 行 。 











启动 psql 时 ， 屏 幕 上 会 显示 该 文件 中 内 容 被 执行 后 的 输出 结果 。 


NULL display is "NULL". 

Timing is on. 

Pager is always used. 

psql (9.6beta3) 

Type "help" for help. 
postgres@localhost:5442 postgresqL_book# 


有 的 psql 设置 命令 仅 适用 于 Linux/Unix 环境 而 不 适用 于 Windows 环境 ， 反 之 亦 然 。 但 不 
管 在 什么 操作 系统 环境 下 ， 在 指定 路 径 时 都 应 使 用 Linux/Unix 风格 的 正 斜 杠 (/)， 其 目的 
是 为 了 区 别 于 指定 选项 时 所 用 的 反 斜 杠 (\)。 如 果 希 望 psql 启动 时 跳 过 加 载 psqlrc 文件 这 
一 步骤 ， 使 用 默认 参数 ， 请 添加 -X 选项 。 

你 可 以 在 psql 运行 时 动态 修改 参数 ， 但 必须 关闭 psql 再 打开 才能 生效 。 如 果 要 删除 某 个 


psql 配置 变量 或 者 希望 将 其 设置 回 默认 值 ， 可 以 使 用 \unset 命令 ， 后 跟 变量 名 称 ， 比 如 ， 
\unset qstat92。 


请 注意 : 使 用 set 命令 时 设置 的 变量 名 是 区 分 大 小 写 的 。 系 统 变 量 请 使 用 大 写 ， 用 户 自 定 
义 变量 请 使 用 小 写 。 在 示例 3-2 中 ，PROMPT1 是 一 个 系统 变量 ， 用 于 指定 psql 终端 界面 上 
的 提示 符 ， 而 qstat92 是 一 个 自 定 义 变量 ， 作 用 是 提供 一 个 查询 PostgreSQL 服务 器 上 当前 
活跃 连接 的 快捷 方式 。 


3.3.1 自 定义 psql 界 面 提示 符 
如 果 你 工作 时 需要 使 用 psql 在 多 台 不 同 的 数据 库 服务 器 或 者 多 个 不 同 的 database 间 切 换 ， 
那么 定制 不 同 的 提示 符 是 很 有 必要 的 。 定 制 后 的 psql 界面 提示 符 可 以 告诉 你 当前 连接 的 是 
哪 台 服务 器 上 的 哪个 database， 从 而 避免 误 操 作 的 发 生 。 下 面 是 设置 带 有 很 多 信息 的 提示 
符 的 一 种 简单 方式 : 

\set PROMPT1 '%nN@%M:%>%x %/# , 
其 中 包括 了 几 个 元 素 : 登录 角色 (%n)、 主 机 名 (%M)、 债 昕 端口 (2)、 事 务 状态 (%x) 以 
及 当前 使 用 的 database 名 (%/)。 这 种 写法 可 能 详细 过 头 了 ， 你 可 以 按 需 裁剪 一 下 。 提 示 符 
所 支持 的 完整 符号 列表 可 从 官方 手册 的 “psql 参考 手册 ”一 节 中 找到 。 
连接 到 数据 库 后 ， 提 示 符 看 起 来 会 像 下 面 这 样 ; 


postgres@localhost:5442 postgresql_book# 
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执行 \connect postgis_book 切换 目标 数据 库 后 ， 提 示 符 会 变 成 下 面 这 样 : 


postgres@localhost:5442 postgis_book# 


3.3.2 ”语句 执行 时 间 统 计 
有 时候 我 们 可 能 会 需要 psql 打印 出 执行 每 个 语句 所 消耗 的 上 时间。 可 通过 \timing 命令 来 打 
开 或 者 关闭 执行 时 间 统 计 开 关 。 


打开 执行 时 间 统 计 开 关 时 ， 每 个 查询 执行 完毕 的 输出 结果 中 都 会 附带 执行 时 长 。 例 如 ， 使 
用 \timing on 命令 执行 SELECT COUNT(*) FROM pg_tables 后 ， 输 出 如 下 : 








(1 row) 
Time: 18.650 ms 


3.3.3 ”事务 自动 提交 

默认 情况 下 ， 自 动 提交 功能 是 处 于 局 用 状态 的 ， 也 就 是 说 任何 一 个 SQL 语句 执行 完毕 后 ， 

它 所 做 的 数据 修改 都 会 被 立即 提交 ， 这 种 情况 下 每 个 语句 都 是 一 个 独立 的 事务 ， 一 旦 执行 

完毕 其 结果 就 不 可 撤销 。 如 果 你 需要 运行 大 量 的 DML 语句 并 且 这 些 语句 还 未 经 充分 测试 ， 

那么 自动 提交 功能 会 带 来 大 麻烦 ， 此 时 有 必要 关闭 事务 自动 提交 机 制 来 保护 数据 。 

请 先 关 闭 自动 提交 功能 : \set AUTOCOMMIT off。 然 后 就 可 以 按 需 对 事务 进行 回 深 了 : 
UPDATE census.facts SET short_name = 'This is a mistake.'; 

要 回 深 事 务 ， 请 执行 : 
ROLLBACK; 

要 提交 事务 ， 请 执行 : 


COMMIT; 
































在 非 自 动 提交 模式 下 请 一 定 要 记得 在 最 后 提交 事务 ， 否 则 未 提交 的 事务 会 在 
退出 psql 时 自动 回 滚 掉 。 
































3.3.4 ”命令 别名 

你 可 以 使 用 \set 来 为 某 个 命令 创建 别名 ， 我 们 建议 你 将 全 局 性 的 别名 写 到 psqlrc 文件 中 。 
例如 ， 如 果 你 每 十 分 钟 就 要 执行 一 次 EXPLAIN ANALYZE VERBOSE， 那 么 每 次 完全 重 输 一 遍 会 
很 烦人 ， 可 以 为 它 起 一 个 别名 。 


\set eav "EXPLAIN ANALYZE VERBOSE ' 














这 样 在 任何 需要 用 到 EXPLAIN ANALYZE VERBOSE 命令 的 地 方 ， 都 可 键入 :eav 替代 (前面 的 
冒号 表示 这 是 一 个 需要 展开 的 命令 变量 ) 。 
:eav SELECT COUNT(*) FROM pg_tables; 


你 其 至 可 以 为 一 个 完整 的 查询 语句 起 个 别名 并 存 入 psqlrc 文件 中 ， 如 同 我 们 在 示例 3-2 中 
所 做 的 一 样 。 建 议 别 名 使 用 小 写字 母 ， 以 避免 与 大 写 的 系统 环境 变量 冲突 。 


3.3.5 ”取出 前 面 执行 过 的 命令 行 

跟 许 多 命令 行 工具 一 样 ， 你 在 psql 中 也 可 以 用 向 上 方向 键 快速 找 出 之 前 执行 过 的 历史 命 
令 。HISTSIZE 环境 变量 决定 了 系统 存储 的 历史 命令 行 的 数量 。 例 如 : \set HISTSIZE 19 会 
将 可 追溯 的 历史 命令 数量 设 定 为 最 多 10 条 。 

如 果 你 正在 编写 一 个 非常 复杂 的 查询 语句 或 者 执行 一 系列 很 关键 的 更 新 操作 ， 那 么 可 能 会 需 
要 将 这 些 语句 存 和 指定 的 文件 中 以 备 后 续 查 看 ， 可 以 使 用 HISTFILE 环境 变量 来 实现 此 功能 。 


\set HISTFILE ~/.psqL_history - :DBNAME 











a 


























Windows 环境 下 不 支持 保存 历史 命令 ， 除 非 是 使 用 Cygwin、MingW 或 者 
MSYS 来 模拟 Unix 环境 。 





3.4 psql 使 用 技巧 


本 市 将 介绍 一 些 被 潭 没 在 大 量 的 psql 文档 中 的 特殊 技巧 。 





3.4.1 执行 shell 命 令 


psql 中 通过 \! 可 以 直接 执行 操作 系统 命令 。 比 如 你 使 用 的 是 Windows 环境 ， 需 要 列 出 当 
前 工作 目录 的 内 容 ， 那 么 不 需要 退出 psql 环境 ， 只 需 直 接 在 psql 界面 上 执行 \! dir 即 可 。 


3.4.2 ”用 watch 命 令 重复 执行 语句 


\watch 命令 是 PostgreSQL 9.3 中 为 psql 引入 的 一 项 新 功能 。 它 可 以 实现 以 固定 的 频率 反复 
执行 某 个 语句 ， 以 便 持 续 观 察 其 输出 。 例 如 你 需要 持续 监控 系统 中 当前 正在 执行 的 所 有 语 
句 的 情况 ， 那 么 只 需 把 watch 语句 加 到 查询 语句 的 后 面 即 可 ， 如 示例 3-3 所 示 。 


示例 3-3 每 10 秒 钟 查询 一 次 所 有 数据 库 连接 上 的 活跃 负载 
SELECT datname, query 
FROM pg_stat _activity 
WHERE state = 'active' AND pid != pg_backend_pid(); 
\watch 10 


虽然 设计 \watch 命令 的 本 意 是 用 于 反复 执行 监控 类 查询 语句 以 便于 持续 观察 系统 状态 ， 但 
你 也 可 以 将 其 用 于 重复 执行 其 他 指定 的 语句 ，watch 命令 并 不 关心 语句 本 身 的 内 容 是 什么 。 
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0 3-4 中 ， 我 们 先 使 用 批量 加 载 方法 创建 了 一 张 表 ， 然 后 每 5 秒 记 录 一 次 系统 负载 信 
息 。 注 意 后 面具 有 跟着 \watch 的 第 二 句 话 才 会 被 每 5 秒 执行 一 次 。 
示例 3-4 每 5 秒 记 录 一 次 系统 负载 情况 


SELECT * INTO Log_activity 
FROM pg_stat_activity; © 

















INSERT INTO log_activity 


SELECT * FROM pg_stat activity; \watch 5 @ 


0 2 pg_stat_activity 为 模板 新 建 一 张 结 构 和 数据 都 完全 相同 的 Log_activity 表 。 
5 秒 重 复 一 次 将 pg_stat_activity 最 新 数据 导入 Log_activity 的 动作 。 


如 果 需 要 终止 watch 进程 ， 请 执行 CTRL-X 加 CTRL-C。 


3.4.3 显示 对 象 信息 


有 多 条 psql 命令 都 能 用 于 显示 数据 库 对 象 列表 ， 并 附带 给 出 每 个 对 象 的 详细 信息 。 示 例 
3-5 展示 了 如 何 列 出 pg_catalog 中 以 pg_t 打头 的 所 有 表 的 信息 ， 同 时 附带 这 些 表 所 占 空间 


的 大 小 。 














示例 3-5 使 用 \dt+ 命令 列 出 表 信息 


\dt+ pg_catalog.pg_t* 


Schema 

pg_catalog 
pg_catalog 
pg_catalog 
pg_catalog 
pg_catalog 
pg_catalog 
pg_catalog 
pg_catalog 


| 
| 
| 
| 
| 
| 
| 
| 
| 


Name | Type | Owner | Size | Description 
------------------ +-------+----------+--------+------------- 
pg_tabLespace | table | postgres | 40 kB | 
pg_trigger | table | postgres | 16 kB | 
pg_ts_config | table | postgres | 40 kB | 
pg_ts_config map | table | postgres | 48 kB | 
pg_ts_dict | table | postgres | 40 kB | 
pg_ts_parser | table | postgres | 40 kB | 
pg_ts template | table | postgres | 40 kB | 
pg_type | table | postgres | 112 kB | 





如 果 需 要 查询 某 个 特定 对 象 的 详细 信息 ， 可 以 使 用 \d+ 命令 ， 如 示例 3-6 所 示 。 


示例 3-6 通过 


\d+ pg_ts_dict 


\d+ 命令 得 到 对 象 的 详细 信息 


Table "pg_catalog.pg_ts_dict" 


Column | Type | Modifiers | Storage | Stats target | Description 
--------------- +------+-----------+----------+--------------+------------- 
dictname | name | not null | plain | | 
dictnamespace | oid | not null | plain | | 

dictowner | oid | not null | plain | | 

dicttemplate | oid | not null | plain | | 
dictinitoption | text | | extended | 

Indexes: 


"pg_ts_dict dictname index" UNIQUE, btree (dictname, dictnamespace) 
"pg_ts_dict oid index" UNIQUE, btree (oid) 


Has OIDs: 


yes 





3.4.4 ” 行 转 列 视图 

PostgreSQL 9.6 中 psql 新 增 支持 了 \crosstabview 命令 ， 这 一 特性 极 大 地 降低 了 视图 行 转 
列 的 难度 。 该 命令 可 以 为 用 户 节约 很 多 时 间 ， 但 只 能 在 psql 命令 行 环境 下 使 用 。 示 例 3-7 
演示 了 如 何 使 用 这 一 特性 ， 后 面 也 会 给 出 详细 的 说 明 。 


示例 3-7 行 转 列 视图 
SELECT student, subject, AVG(score)::numeric(5,2) As avg_score 
FROM test_scores 
GROUP BY student, subject 
ORDER BY student, subject 
\crosstabview student subject avg_score 























student | algebra | calculus | chemistry | physics | scheme 


--- + 
alex |74.00 |73.50 | 82.00 | 81.00 | 

leo | 82.00 | 65.50 | 75.50 | 72.00 | 

regina | 72.50 | 64.50 | 73.50 | 84.00 | 90.00 
sonia |76.50 | 67.50 | 84.00 | 72.00 | 


(4 rows) 


\crosstabview 命令 应 紧 跟 在 你 希望 实现 行 转 列 的 SQL 语句 后 面 。\crosstabview 命令 的 
输入 是 前 面 SQL 语句 中 查询 的 三 个 字段 ， 后 面 还 可 以 跟 一 个 可 选 的 排序 字段 。 该 命令 
实现 的 效果 是 对 原生 查询 结果 进行 行 转 列 后 重 排 : 第 一 个 字段 是 一 行 的 标记 ， 第 二 个 字 
段 被 翻转 为 列 ， 第 三 个 字段 按照 第 一 个 和 第 二 个 字段 的 每 种 排列 组 合作 为 值 出 现 。 执 行 
\crosstabview 命令 时 也 可 以 不 输入 字段 名 ， 这 就 要 求 前 面 的 SQL 查询 语句 中 只 能 查询 三 
个 字段 ， 命 令 默 认 就 会 去 取 这 三 个 字段 作为 人 参 。 

在 示例 3-7 中 ，student 是 行 的 标记 字段 ，subject 是 行 转 列 后 铺 开 的 字段 ，avg_score 会 
在 前 两 个 字段 排列 组 合 而 成 的 每 个 交叉 点 处 作为 值 出 现 。 如 果 查 询 结 果 中 某 个 特定 的 
student-subject 组 合 不 存在 ， 则 其 值 为 空 。 我 们 可 以 在 \crosstabview 命令 的 入 参 中 显 式 输 
入 字段 名 ， 但 当 SQL 本 身 的 查询 字段 列表 就 是 我 们 想 要 的 列表 时 ， 我 们 可 以 不 输入 。 


3.4.5 ”执行 动态 SQL 


有 时 我 们 会 需要 根据 某 个 查询 的 结果 动态 构造 出 SQL 语句 ， 然 后 执行 它 。 在 PostgreSQL 
9.6 之 前 的 版 本 中 ， 需 要 先 构 造 出 SQL， 然 后 将 其 输出 到 外 部 脚本 文件 ， 再 执行 脚本 文 
件 。 当 然 ， 你 也 可 以 选择 使 用 D0 语法 ， 但 对 于 长 SQL 语句 来 说 用 起 来 很 不 方便 。 从 
PostgreSQL 9.6 开始 ， 你 可 以 选择 使 用 \gexec 命令 来 执行 动态 生成 的 SQL， 其 特点 是 生成 
SQL 和 执行 SQL 在 同一 步骤 中 完成 ， 非 常 方便 。 该 命令 会 遍历 查询 输出 结果 中 的 每 一 行 
并 执行 其 中 的 SQL 语句 。 允 历 顺序 是 外 层 按 记录 行 迭 代 ， 内 层 按 字段 迭代 。gexec 命令 还 
没有 支持 识别 每 行 记录 中 的 每 个 字段 是 否 都 是 一 个 SQL， 目前 仅 支 持 每 行 是 一 个 SQL 的 
情况 。 另 外 ，gexec 仅仅 机 械 地 遍历 执行 所 有 SQL， 并 不 关心 每 个 SQL 的 执行 结果 ， 即 使 
中 途 有 SQL 执行 出 错 ，gexec 依然 会 继续 遍历 执行 下 去 ， 但 它 在 遍历 查找 SQL 的 过 程 中 会 
识别 出 null 记录 并 跳 过 。 示 例 3-8 中 创建 了 两 张 表 并 使 用 \gexec 实现 了 往 每 张 表 中 插入 一 
条 记录 。 
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示例 3-8 使 用 gexec 创建 表 并 插入 数据 


SELECT 
'CREATE TABLE ' || person.name || '( a integer, b integer)' As create, 
'INSERT INTO ' || person.name || ' VALUES(1,2) ' AS insert 


FROM (VALUES ('leo'),('regina')) AS person (name) \gexec 
CREATE TABLE 
INSERT 0 1 


CREATE TABLE 
INSERT 0 1 


在 示例 3-9 中 ， 我 们 使 用 gexec 来 查询 information_schema 中 的 表 ， 获 取 元 数据 。 
示例 3-9 使 用 gexec 获取 每 张 表 中 的 记录 数 





SELECT 
"SELECT ' || quote literal(table name) || ' AS table_name, 
COUNT(*) As count FROM ' || quote ident(table name) AS cnt_q 


FROM information_schema.tables 
WHERE table name IN ('leo','regina') \gexec 


table_name | count 


tabLe_name | count 
eT ee 
regina | 1 

(1 row) 


3.5 ”使 用 psql 实 现 数 据 的 导入 和 导出 


psql 支持 一 个 叫 作 \copy 的 命令 ， 该 命令 可 以 将 数据 导出 到 文本 文件 中 ， 也 可 以 从 文本 文 
件 中 导入 数据 。 文 本 文件 中 默认 使 用 制 表 符 作为 分 隔 符 ， 当 然 你 也 可 以 指定 使 用 其 他 分 隔 
符 。 文 本 中 必须 使 用 换行 符 来 分 隔 不 同 的 行 ， 否 则 无 法 正确 区 分 两 行 记录 。 我 们 采用 美国 
人 口 普查 数据 网 站 上 提供 的 马萨诸塞 州 人 口 统计 数据 来 作为 我 们 的 第 一 个 例子 。 你 可 以 从 
链接 http:/www.postgresonline.com/downloads/postgresql_book_2e.zip 中 下 载 我 们 接 下 来 要 
用 到 的 DEC_10_SF1_QTHI1_with_ann.csv 文件 。 


3.5.1 使 用 psql 进 行 数据 导入 

需要 导入 非 规范 化 数据 或 者 需要 导入 我 们 不 太 了 解 其 特征 的 数据 时 ， 我 们 一 般 建议 这 么 
做 : 首先， 新 建 一 个 独立 的 schema 来 作为 数据 过 渡 区 ， 将 新 数据 导入 此 schema 中 ; 然 
后 ， 通 过 一 些 查 询 来 摸 清 这 些 数 据 的 特性 ， 最 后 才 把 这 些 数据 分 门 别 类 导入 到 正式 的 产品 
表 中 ， 并 删除 之 前 建立 的 过 渡 区 schema。 

在 将 数据 导入 PostgreSQL 之 前 ， 需 要 先 建立 一 张 表 来 容纳 新 数据 ， 而 且 表 的 列 数 和 数据 
类 型 必须 与 待 导 入 的 数据 一 致 。 如 果 一 个 待 导入 的 文本 文件 的 内 部 列 和 记录 结构 清晰 有 
序 ， 那 么 这 个 建 表 步 又 理论 上 是 可 以 省 略 的 ， 因 为 psql 可 以 自动 判断 每 个 列 的 类 型 并 自动 
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把 表 建 好 ， 但 为 了 避免 出 现 psql 自动 判断 数据 类 型 出 错 的 情况 ， 这 个 步骤 最 好 不 要 省 略 。 
psql 把 整个 导入 过 程 当成 一 个 完整 的 事务 来 处 理 ， 因 此 如 果 导 入 数据 时 遇 到 任何 错误 ， 那 
么 整个 导入 动作 所 做 的 修改 会 完全 回 滚 掉 。 如 果 你 对 源 文件 中 数据 的 特点 并 不 完全 了 解 ， 
我 们 建议 你 用 最 宽松 的 条 件 来 创建 容纳 表 ， 等 数据 导入 之 后 再 对 数据 进行 细 化 加 工 。 例 
如 ， 如 果 你 不 确定 某 一 列 是 否 全 都 是 数字 ， 那 么 可 以 将 该 列 的 数据 类 型 设置 为 character 
varying， 等 数据 导入 之 后 再 执行 检查 ， 稍 后 再 进行 转换 。 


示例 3-10 会 向 我 们 在 示例 3-1 中 创建 的 表 中 导入 数据 。 打 开 psql 并 执行 示例 3-10 中 的 命令 。 
示例 3-10 使 用 psql 导入 数据 


\connect postgresqL_book 
\cd /postgresql_book/ch03 
\copy staging.factfinder_import FROM DEC_10_SF1_QTH1_with_ann.csv CSV 


在 上 面 的 示例 中 ， 我 们 在 psql 的 交互 模式 下 执行 了 导入 过 程 : 首先 连接 数据 库 ， 然 后 使 用 

\cd 切换 到 含有 数据 源 文件 的 目录 ， 最 后 执行 \copy 导入 动作 。 因 为 \copy 命令 支持 的 默 

认 分 隔 符 是 制 表 符 ， 所 以 我 们 必须 在 命令 行 中 额外 指明 源 文件 是 用 喜 号 作为 分 隔 符 的 CSV 

格式 。 

如 果 源 文件 使 用 了 一 些 非 标准 的 分 隔 符 ， 比 如 竖 杠 (|)， 那 么 也 请 在 命令 中 以 如 下 方式 指明 : 
\copy sometable FROM somefile.txt DELIMITER '|'; 

如 果 希 望 把 文本 中 的 空 值 替换 为 你 指定 的 内 容 再 导入 ， 可 以 用 NULL As 来 标记 要 替换 的 内 容 : 


\copy sometable FROM somefile.txt NULL As ' 






































请 不 要 将 psql 中 的 \copy 命令 与 SQL 语言 提供 的 COPY 语句 相 混 淆 。psql 是 
一 个 客户 端 工具 ， 所 有 路 径 都 是 相对 于 已 连接 客户 端 进行 解释 的 。 而 SQL 
copy 是 基于 服务 器 的 ， 并 在 postgres 服务 操作 系统 账户 的 环境 下 运行 。 
此 输入 文件 必须 驻 留 在 可 由 postgres 服务 账户 访问 的 路 径 中 。 














3.5.2 ”使 用 psdl 进 行 数 据 导出 


psql 的 数据 导出 功能 比 导 入 功能 更 简单 、 更 灵活 ， 你 甚至 可 以 指定 仅 导出 某 张 表 的 某 一 部 
分 记录 。 导 出 时 使 用 的 依然 是 psql 的 \copy 命令 。 在 示例 3-11 中 ， 我 们 将 演示 如 何 将 前 面 
刚刚 导入 库 中 的 数据 再 导 回 到 以 制 表 符 为 分 隔 符 的 文本 中 。 


示例 3-11 使 用 psql 导出 数据 
\connect postgresqL_book 
\copy (SELECT * FROM staging.factfinder_import WHERE sO01 ~ E'^[0-9]+' ) 
TO '/test.tab' 
WITH DELIMITER E'\t' CSV HEADER 


默认 情况 下 psql 导出 数据 时 会 使 用 tab 键 作 为 分 隔 符 。 然 而 ， 以 这 种 格式 导出 时 默认 不 导 
出 标题 行 。 你 可 以 通过 指定 HEADER 选项 来 要 求 导 出 标题 行 ， 请 注意 该 选项 仅 当 输出 格式 为 
CSV 时 才 可 使 用 (参见 示例 3-12)。 
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示例 3-12 使 用 psql 导出 数据 
\connect postgresqL_book 
\copy staging.factfinder_import TO '/test.csv' 
WITH CSV HEADER QUOTE '"' FORCE QUOTE * 


FORCE QUOTE * 表示 输出 的 所 有 列 的 前 后 都 将 加 上 引用 符 ， 这 个 引用 符 默 认 就 是 双 引 号 ， 但 





为 清晰 起 见 ， 我 们 还 是 显 式 指定 了 一 下 。 


3.5.3 ”从 外 部 程序 复制 数据 以 及 将 数据 复制 到 外 部 程序 


从 PostgreSQL 9.3 版 开始 ，psql 开始 支持 从 命令 行程 序 的 输出 中 获取 数据 并 将 数据 转 储 到 
表 中 ， 这 类 命令 行程 序 包 括 curL、Ls 和 wget 等。 示例 3-13 演示 了 如 何 使 用 dir 命令 将 一 











个 目录 下 的 文件 列表 导入 表 中 。 
示例 3-13 使 用 psql 导入 某 个 目录 下 的 文件 列表 


\connect postgresqL_book 
CREATE TABLE dir_list (filename text); 
\copy dir_list FROM PROGRAM 'dir C:\projects /b' 


Hubert Lubaczewski 在 博文 “Piping copy to/from an external program” 中 介绍 了 更 多 关于 使 


用 \copy 命令 的 例子 。 


3.6 ”使 用 psql 制 作 简 单 的 报表 





你 也 许 会 觉得 难以 置信 ， 但 psql 的 确 能 够 制作 简单 的 HTML 报表 。 请 执行 以 下 命令 并 查 

















看 生成 的 HTML 报表 ， 它 应 该 类 似 图 3-1 所 展示 的 样子 。 


psql -d postgresqL_book -H -c 
SELECT category, count(*) As num_per_cat 
FROM pg_settings 

WHERE category LIKE “'%Query% 

GROUP BY category 

ORDER BY category; 

" -0 test.html 








category 
Query Tuning / Genetic Query Optimizer 
Query Tuning / Other Planner Options 
Query Tuning / Planner Cost Constants 
Query Tuning / Planner Method Configuration 


Statistics / Query and Index Statistics Collector 


(S rows) 





num per cat 





3-1: 简单 的 HTML 报表 





| 大 
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上 面 的 报表 看 起 来 还 算 凑 合 ， 但 这 仅仅 是 输出 了 一 个 HTML 表格 ， 还 称 不 上 是 一 个 完全 符 
合格 式 要 求 的 HTML 文档 。 为 了 让 该 报表 的 内 容 更 丰富 一 些 ， 我 们 需要 写 一 个 脚本 来 作为 











轴 





ji 助 ， 内 容 见 示例 3-14。 


示例 3-14 编写 settings_report.psql 文件 来 设置 报表 内 容 


©O@Oe 


© 


\0 settings_report.html © 

\T 'cellspacing=0 ceLLpadding=0' @ 

\qecho '<html><head><style>H2{color:maroon}</style>' © 

\qecho “<titLe>PostgreSQL Settings</title></head><body>' 

\qecho '<table><tr valign="''top''><td><h2>Planner Settings</h2>' 
\xon@ 

\t on 日 

\pset format htmL @ 

SELECT category, 

string_agg(name || '=' || setting, E'\n' ORDER BY name) As settings @ 
FROM pg_settings 

WHERE category LIKE '%Planner%' 

GROUP BY category 

ORDER BY category; 

\H 

\qecho '</td><td><h2>File Locations</h2>' 

\x off @ 

\t on 

\pset format html 

SELECT name, setting FROM pg_settings WHERE category = 'File Locations’ 
ORDER BY name; 

\qecho '<h2>Memory Settings</h2>' 

SELECT name, setting, unit FROM pg_settings WHERE category ILIKE '%memory%' 
ORDER BY name; 

\qecho '</td></tr></table>' 

\qecho '</body></htmL>' 

\o 


间 定 查询 结果 输出 到 一 个 文件 中 。 
HTML 表格 的 输出 格式 设置 。 
添加 一 些 附加 的 HTML 代码 。 
打开 记录 输出 的 展开 模式 。 重 复 每 一 个 记录 的 列 标题 ， 并 将 每 一 个 记录 的 每 一 列 作为 一 
个 单独 的 记录 输出 。 
虽 制 查询 的 结果 输出 为 一 个 HITML 表格 。 






































@ string_agg() 是 PostgreSQL 9.0 中 引入 的 一 个 国 数 ， 可 以 将 聚合 运算 中 被 划 为 同 组 的 字 





符 串 值 合并 为 单个 字符 串 。 



































@ 关闭 记录 输出 的 展开 模式 ， 这 样 第 二 个 和 第 三 个 查询 结果 在 报表 上 的 输出 格式 应 该 是 每 





条 记录 仅 占 一 行 。 








@ 设置 “是 否 仅 输出 记录 ”开关 。 如 有 果 此 开关 是 开局 的 ， 则 会 忽略 列 标题 和 行 计 数 。 











示例 3-14 演示 了 通过 灵活 使 用 SQL 和 psql 命令 可 以 创建 出 一 个 内 容 丰 富 的 综合 性 分 层 
报表 。 要 运行 示例 3-14 中 的 脚本 有 两 种 方法 : 可 以 使 用 psql 以 交互 方式 连接 并 执行 \i 
settings_report.psqL， 也 可 以 在 操作 系统 的 命令 行 界面 上 运行 psqL -f settings_report. 
psqL。settings_reporthtml 生成 的 输出 结果 如 图 3-2 所 示 。 
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Planner Settings 


File Locations 





config file 


|C-/projects/pg/pg92edbydata/postgresqlLconfl 








category Query Tuning / Other Planner Options 


data_directory 


IC-/projects/pg/pg92edby/data 





settings jconstraint exclusion=partition 
cursor_tuple_fraction=0.1 
default statistics_target=100 
from collapse limit=8 
ljoin_collapse_limit=8 





category|Query Tuning / Planner Cost Constants 





settings cpu_index_tuple_cost=0.005 
cpu_operator_cost=0.0025 
[cpu_tuple_cost=0.0 1 
leffective_cache size=16384 
en | page_cost=4 

seq page cost=1 











category Query Tuning / Planner Method 
IConfiguration 


external pid file 





lhba_file 





(C:/projects/pg/pg92edb/data/pg hba conf 





ident file 


IC:/projects/pg/p292edb/data/pg ident.conf | 








Imaintenance work mem 


Memory Settings 


|16384kB 





Imax_ prepared transactions|O | 











lmax_stack depth 2048 kB 
shared buffers 4096 I8kB 
temp_buffers 1024 |8kB 





track activity query_size |1024 | | 








Iwork_ mem 











settings enable_bitmapscan=on 
enable_ hashagg=on 
lenable hashjoin=on 
lenable indexonlyscan=on 
lenable_indexscan=on 





ab bl 








3-2: 复杂 的 HTML 报表 


如 上 所 示 ， 通 过 构造 psql 脚本 可 以 实现 将 多 个 查询 的 输出 结果 整合 到 一 个 报表 中 。 男 外 ， 


你 还 可 以 通过 pgAgent、crontab 或 者 Windows 定时 任务 管理 器 等 工具 定时 执行 脚本 。 
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pgAdmin 的 使 用 








pgAdmin4 是 一 款 PostgreSQL 图 形 化 管理 工具 ， 其 可 靠 性 和 实用 性 已 入 经 考验 ， 目 前 最 新 版 
本 是 V1.6。 相 较 其 前 任 pgAdmin3，pgAdmin4 经 过 了 彻底 的 改写 。pgAdmin3 所 支持 的 一 些 
特性 还 没有 移植 到 pgAdmin4， 但 将 来 都 会 移植 过 来 。 本 章 将 聚焦 于 pgAdmin4 的 现 有 功能 。 
pgAdmin4 的 大 部 分 功能 在 pgAdmin3 中 也 都 有 ， 因 此 本 章 内 容 对 于 pgAdmin3 用 户 也 有 价 
值 。 本 章 还 会 介绍 一 些 在 pgAdmin3 中 运用 广泛 但 尚未 移植 到 pgAdmin4 的 特性 。 后 续 我 们 
将 统一 使 用 pgAdmin 来 称呼 这 两 个 版 本 ， 仅 当 二 者 在 功能 上 有 差异 时 才 会 加 上 版 本 号 。 


到 目前 为 止 , pgAdmin4 相对 于 pgAdmin3 的 主要 变化 包括 : 对 于 较 新 的 
PostgreSQL 9.6 和 PostgreSQL 10 支持 较 好 ， 支 持 以 浏览 器 或 桌面 应 用 两 种 
模式 运行 ， 支 持 在 查询 结果 窗 格 中 直接 对 记录 进行 编辑 ， 支 持 同时 选中 查 
询 结 果 窗 格 中 的 非 邻 接 项 ， 性 能 方面 的 提升 。 如 果 你 在 Windows 平台 上 工 
作 ， 请 一 定 要 使 用 pgAdmin4 的 V1.6 或 者 更 高 的 版 本 ，V1.6 之 前 的 版 本 在 
Windows 下 以 桌面 模式 运行 时 存在 性 能 问题 。 
































虽然 pgAdmin 有 其 缺点 ， 但 开发 组 对 bug 的 修复 一 直 都 很 及 时 ， 而 且 也 在 不 停 地 为 其 添加 
新 的 功能 特性 。 因 为 PostgreSQL 社区 的 开发 者 们 将 其 定位 为 使 用 最 广泛 的 PostgreSQL 
形 化 管理 工具 ， 并 且 在 很 多 PostgreSQL 发 行 包 中 都 会 附带 ， 所 以 开发 者 们 一 直 确 保 它 与 最 
新 版 本 的 PostgreSQL 保持 同步 更 新 。 如 果 新 版 本 的 PostgreSQL 中 引入 了 一 个 新 特性 ， 那 
么 最 新 版 本 的 pgAdmin 一 定 会 支持 对 此 特性 进行 管理 。 如 果 你 是 PostgreSQL 新 手 ， 那 么 
选择 pgAdmin 作为 入 门 工具 青 定 没 错 。 


4.1 pgAdmin 入 门 


很 多 PostgreSQL 发 行 包 中 都 附带 有 pgAdmin4。BigSQL 和 EDB 的 PostgreSQL 发 行 包 自 
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从 9.6 版 之 后 就 包含 了 pgAdmin4 作为 一 个 可 选 安装 项 。 如 果 你 需要 使 用 pgAdmin3 工具 来 
管理 PostgreSQL 9.6 之 后 的 版 本 ， 可 以 使 用 BigSQL 提供 的 pgAdmin3 LTS， 该 版 本 已 经 针 
对 PostgreSQL 9.6 和 PostgreSQL 10 做 了 适 配 更 新 。 用 BigSQL 公司 的 包 管 理 器 工具 可 以 
安装 pgAdmin3 LTS。 从 PostgreSQL 9.5 起 ，EDB 公司 的 发 行 包 中 就 只 包含 pgAdmin4 了 。 
pgAdmin 开发 组 也 不 会 再 对 pgAdmin3 做 任何 的 功能 增强 。 


如 果 只 需 安装 pgAdmin 而 无 须 安装 PostgreSQL 本 身 ， 你 可 以 从 pgAdmin 的 官网 下 载 
pgAdmin 的 安装 包 。 该 网 站 还 提供 了 pgAdmin 的 使 用 手册 ， 你 可 以 仔细 研读 一 下 。 该 
工具 的 功能 设计 清晰 有 序 ， 而 且 大 部 分 功能 是 自 解释 的 ， 也 就 是 说 你 仅 赁 摸索 而 无 须 专 
门 指导 即 可 了 解 其 使 用 方法 。 对 于 那些 爱 “ 尝 鲜 ” 的 用 户 来 说 ， 可 以 尝试 使 用 测试 版 ， 
PostgreSQL 社区 将 很 感谢 你 对 测试 版 进行 试用 并 反馈 bug。 


4.1.1 功能 概览 
下 面 会 先 列 出 我 们 认为 最 精华 的 部 分 功能 ， 不 过 这 只 是 小 试 牛 刀 ， 更 多 内 容 请 参见 
pgAdmin 官网 上 的 功能 介绍 页 面 。 
同时 支持 服务 器 模式 和 桌面 应 用 模式 
pgAdmin4 同时 支持 以 桌面 模式 和 服务 器 模式 安装 ， 前 者 是 以 本 地 应 用 的 方式 运行 ， 后 者 
是 一 个 基于 WSGI 规 范 的 Web 应 用 ， 可 以 通过 浏览 器 访问 。pgAdmin3 仅 支 持 桌面 模式 。 
执行 计划 的 图 形 化 解释 功能 
该 功能 非常 有 用 ， 它 能 够 以 图 形 化 方式 展示 执行 计划 。 当 然 原来 那 种 元 长 的 文本 形式 的 
执行 计划 也 会 继续 存在 ， 但 图 形 化 方式 展示 的 执行 计划 会 让 用 户 对 整个 执行 计划 了 解 得 
更 加 深入 和 全 面 。 
SQL 执行 面板 
不 管 在 界面 上 执行 什么 样 的 操作 ，pgAdmin 最 终 都 要 通过 SQL 语句 来 与 PostgreSQL 服 
务 端 进行 交互 ， 系 统 人 允许 你 查看 这 种 底层 SQL。 当 你 使 用 图 形 化 界面 对 数据 库 服务 器 
进行 操作 时 ，pgAdmin 会 自动 在 SQL 结果 窗 格 中 展示 这 些 自动 生成 的 SQL 语句 。 对 于 
新 手 来 说 ， 研 究 这 种 自动 生成 的 SQL 是 极 好 的 学 习 途 径 。 对 专家 来 说 ， 好 好 利用 这 种 
自动 生成 的 SQL 可 以 节省 大 量 时 间 。 
postgresql.conf 和 pg_hba.conf 等 配置 文件 的 图 形 化 编辑 器 
你 不 再 需要 四 处 寻找 配置 文件 的 位 置 并 使 用 文本 编辑 器 来 修改 它们 ， 在 pgAdmin 上 
可 以 一 站 式 搞 定 。 该 功能 当前 仅 在 pgAdmin3 中 支持 ， 而 且 使 用 该 功能 需要 预先 在 
postgres database 中 安装 名 为 pgadmin 的 扩展 包 。 
数据 导入 和 导出 
pgAdmin 能 够 轻易 地 将 语句 查询 结果 导出 为 CSV 文件 或 者 基于 其 他 分 隔 符 的 文本 文件 ， 
当然 也 可 以 将 这 类 文件 导入 到 数据 库 中 。pgAdmin3 甚至 支持 将 表 数 据 导出 为 HTML 格 
式 ， 因 此 可 以 当 作 一 个 简易 的 一 键 式 报表 服务 器 来 用 。 


备份 与 恢复 向 导 
如 果 你 记 不 住 pg_restore 和 pg_dump 命令 的 大 量 选项 ， 没 关系 ，pgAdmin 提供 了 一 个 
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很 友好 的 图 形 化 界面 来 帮 你 设 定 这 些 选 项 ， 通 过 调整 这 些 选 项 可 以 实现 对 database、 
schema、 单 张 表 以 及 全 局 对 象 进行 定制 化 的 备份 或 者 恢复 。 你 可 以 在 备份 恢复 界面 的 
“消息 ”选项 卡 上 看 到 系统 自动 生成 的 pg_dump 或 pg_restore 命令 行 语句 ， 如 果 你 觉得 
有 必要 ， 完 全 可 以 把 这 些 语句 复制 下 来 作为 例句 使 用 。 

授权 向 导 
该 功能 可 以 帮助 你 一 次 性 对 很 多 数据 库 对 象 进行 授权 或 者 解除 授权 操作 ， 从 而 大 大 节省 
你 的 时 间 。 

pgScript 脚本 执行 引擎 
pgScript 是 一 种 速度 很 快 但 不 太 “ 正 规 ” 的 脚本 执行 机 制 ， 该 机 制 不 要 求 整 个 脚本 中 执 
行 的 所 有 操作 构成 一 个 事务 。 在 pgScript 中 ， 你 可 以 在 一 个 循环 语句 的 每 一 次 循环 中 都 
执行 一 次 提交 操作 ， 如 果 是 在 函数 中 ， 那 么 只 能 是 所 有 循环 都 结束 后 才能 执行 提交 。 很 
遗憾 的 是 ， 这 种 灵活 的 机 制 只 能 在 pgAdmin3 中 使 用 (pgAdmin4 还 不 支持 )。 

SQL 编辑 器 的 自动 补 全 功能 
用 CTRL 加 空格 键 可 以 激活 自动 补 全 功能 ， 该 功能 在 pgAdmin4 中 得 到 了 进一步 的 完善 。 

pgAgent 定时 任务 工具 
pgAgent 是 一 种 跨 平台 的 定时 任务 计划 工具 ， 后 续 将 使 用 一 整 节 来 介绍 它 。pgAdmin 提 
供 了 一 套 很 完善 的 用 于 访问 pgAgent 的 接口 。 























4.1.2 ”如 何 连 接 到 PostgreSQL 服 务 器 


通过 pgAdmin 连接 到 PostgreSQL 服务 器 很 简单 ， 其 通用 (General) 和 连接 (Connection) 
选项 卡 如 图 4-1 所 示 。 


























看 Create - Server |x| [i jx 
General | ” Connect tion General Connec| tion 
Name Host 
name/address 
Server group 目 Servers 
Port 5432 
Connectnow? 问 
Maintenance postgres 
Comments database 
Username postgres 
Password 
Save 
password? 
Role 
SSL mode Prefer 了 | 
9 | a D ww 到 

















图 4-1: pgAdmin4 注册 服务 器 连接 对 话 杠 
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4.1.3 pgAdmin 界 面 导航 


pgAdmin 界面 左 侧 的 树 状 目录 布局 看 起 来 很 直观 ， 但 由 于 它 直 接 把 所 有 底层 数据 库 对 象 呈 
现 给 了 用 户 ， 所 以 可 能 让 人 毫 无 头绪 。 你 可 以 打开 Files 一 Preferences 页 面 ， 点 开 左 侧 的 
Nodes 页 面 ， 然 后 色 选 掉 你 不 希望 看 到 的 数据 库 对 象 类 型 ， 这 样 主页 面 上 显示 的 目录 树 就 
会 精简 很 多 。 可 以 通过 菜单 栏 上 的 Files (文件 ) 一 Preferences (偏好 ) 一 Browser (浏览 
器 ) 一 Nodes (显示 节点 ) 来 打开 目录 树 定制 面板 。 你 将 看 到 如 图 4-2 所 示 的 界面 。 




















Preferences 





日 - Browser Casts 


Constraints 
Extensions 


FTS Configurations 


Display 
a Catalog Objects 
日 Dashboards EE 
Catalogs Show 本 
Graphs [Snow| 
B+ Debugger Check Constraints 
Display LI 
于 Collations Show 
Bl Miscellaneous ED 
User language Columns 
-Paths 
Constraints 
Binary paths ED 
Help Databases 
-SQL Editor 
Display Domain Constraints 
Explain Domains ED 
Options 
白 - storage Event Triggers EH 
ee Exclusion ED 
ET 


FTS Dictionaries 


? 和] 
图 4-2: 在 pgAdmin4 的 树 状 浏览 目录 中 隐藏 或 者 显示 特定 类 型 的 数据 库 对 象 


如 果 在 Browser 一 Display 页 面 上 勾 选 了 “在 树 状 目 录 中 显示 系统 对 象 ”， 那 么 你 将 看 到 
PostgreSQL 服务 器 的 内 部 对 象 ， 包 括 内 部 函数 、 系 统 表 、 表 的 隐藏 字段 等 。 你 还 将 看 到 
PostgreSQL 系统 schema 中 存储 的 元 数据 ， 包 括 information_schema 和 pg_catalog 这 两 个 
catalog 中 的 内 容 。 其 中 information_schema 是 ANSI SQL 标准 中 规定 必须 要 有 的 ， 因 此 在 
别 的 数据 库 (比如 MySQL 和 SQL Server) 中 也 会 存在 。 你 可 能 会 认 出 一 些 在 使 用 其 他 数 
据 库 产品 时 曾经 见 过 的 表 和 字段 。 


4.2 pgAdmin 功 能 特性 介绍 


pgAdmin 工具 的 功能 丰富 而 强大 ， 本 书 的 篇 幅 不 足以 全 面 描 述 ， 因 此 我 们 仅 重点 介绍 一 些 
比较 常用 的 功能 。 





























4.2.1 根据 表 定 义 自 动 生 成 SQL 语句 
pgAdmin 有 一 个 基于 表 定 义 自动 生成 SELECT、INSERT、UPDATE 语句 模板 的 菜单 。 在 表 名 上 
点 击 右键 ， 深 动 到 其 中 的 Scripts 栏 ， 即 可 找到 该 菜单 ， 界 面 如 图 4-3 所 示 。 























羡 test_scores 


Types 

Views 
iging 
aoles 


5 





' Trigger Functions # Create 


人 Refresh_ 

兽 Delete/Drop 

兽 Drop Cascade 

ll Reset Statistics 

EE Import/Export... 

££ Maintenance... 
Scripts 
Truncate 

Backup... 

之 Restore... 

3 View/Edit Data 

5 Query Tool... 

区 Properties... 


» 


上 


AU CREATE Script 
及 DELETE Script 
及 INSERT Script 
及 SELECT Script 
w UPDATE Script 














4-3: 表 脚本 自动 生成 菜单 


其 中 的 “SELECT Script” 项 特别 好 用 ， 它 一 点 开 就 会 自动 生成 一 个 包含 了 该 表 所 有 字段 的 
查询 语句 。 如 果 表 有 很 多 字段 ， 而 你 又 需要 查询 其 中 的 大 部 分 字段 ， 那 么 这 个 自动 生成 的 
语句 会 为 你 节省 很 多 时 间 ， 只 需 把 你 不 想 要 的 字段 从 脚本 中 删除 即 可 。 


4.2.2 ”在 pgAdmin3 中 调用 psql 


尽管 pgAdmin 拥有 功能 强大 的 图 形 界面 ， 但 有 些 时 候 还 是 离 不 开 psql。 比 如 需要 执行 
pg_dump 或 其 他 数据 转 储 工具 生成 的 体积 庞大 的 SQL 文件 时 ，psql 就 更 合适 。 从 pgAdmin3 
界面 很 容易 打开 psql 工具 (请 注意 该 特性 仅 在 pgAdmin3 中 可 用 ，pgAdmin4 还 不 支持 )， 
只 需 点 击 “ 插 件 ” 菜 单 下 的 “PSQL Console” 项 即 可 ， 如 图 4-4 所 示 。 这 样 就 会 启动 一 个 
psql 窗口 并 连接 到 当前 pgAdmin 环境 中 已 连接 的 database 上 ， 然 后 你 可 以 使 用 \cd 以 及 \i 
命令 来 改变 目录 并 执行 SQL 文件 。 




































































EE, 


PSQL Console 











4-4: psql 插件 











请 注意 : 该 功能 需要 确保 针对 某 database 的 连接 已 建立 好 ， 因 此 只 有 当 pgAdmin 已 连 上 
PostgreSQL 服务 器 并 选中 某 个 database 时 ,“ 插 件 ” 菜 单 下 的 “PSQL Console” 项 才 会 变 





成 可 用 状态 。 
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4.2.3 在 pgAdmin3 中 编辑 postgresdql.conf 和 pg_hba.conf 
文件 


只 要 服务 器 上 安装 了 adminpack 扩展 包 ， 那 么 你 就 可 以 在 pgAdmin 界面 上 直接 编辑 配置 
文件 。 一 般 来 说 ，PostgreSQL 的 一 键 式 安装 包 都 会 自动 安装 好 adminpack 扩展 包 。 只 
该 插件 已 安装 ， 你 就 可 以 看 到 Server Configuration (服务 器 配置 ) 菜单 已 启用 ， 如 图 4-5 
所 示 。 














Server Configuration postgresql,conf 
pg_hba,conf 








ROUTEW 








Serwer Status 











4-5: pgAdmin3 配置 文件 编辑 器 


如 果 你 的 pgAdmin 已 连接 到 PostgreSQL 服务 器 但 Server Configuration 菜单 却 是 灰 的 ， 那 么 
要 么 是 没 安装 adminpack， 要 么 是 你 不 是 以 超级 用 户 身 份 登录 的 。 如 果 要 安装 adminpack， 
执行 CREATE EXTENSION adminpack 即 可 ,或 者 也 可 以 通过 图 形 界面 来 安装 ， 如 图 4-6 所 示 。 
安装 好 以 后 请 断 开 与 服务 器 的 连接 并 重 连 ， 然 后 就 可 以 看 到 菜单 已 可 点 击 。 









































5ervers (2) 
吧 local 10 +1 Create - Extension [x | 
BH- 目 Databases (4) 
BB-[)| postgres General Definition SQL 
由 - 贸 casts 
Name 
争 Catalogs 
由 - 哗 Event Triggers Select from the list a 
号 | 心 Extensions (1) 
只 plpgsql | 
由 i | 
哈 Foreign Data Wrappe adminpack 
由 Languages 
日 争 Schemas (4) bloom 
@potempl btree_gin 
© pg_toast 
由 - 仿 pg_toast temp _1 btree_gist | 
外-@ pubiic 站 dblink 面 














4-6: 使 用 pgAdmin4 安装 扩展 包 


4.2.4 创建 数据 库 对 象 并 设置 权限 
pgAdmin 允许 你 创建 各 种 数据 库 对 象 并 对 其 进行 权限 设置 。 





1. 创建 数据 库 以 及 其 他 数据 库 对 象 

利用 pgAdmin 创建 一 个 新 的 数据 库 非 常 简单 ， 只 需 右 键 单 击 树 上 的 database 节点 并 选择 
New Database (新 建 数 据 库 ) 即 可 ， 如 图 4-7 所 示 。Definition (定义 ) 选项 卡 上 提供 了 一 
个 下 拉 菜 单 供 选 择 建 库 所 用 的 模板 数据 库 ， 我 们 在 2.4.1 节 中 介绍 过 相关 内 容 。 


乔 Create - Database 回 


General “Definition Security Parameters SQL 




















Encoding UTF8 x 
Template Select from the list Md 
Tablespace Select from the list v 
Collation Se ect from the list ” 
Character type | Select from the list MM 
Connection -有 

limit 








ws 
~ 














图 4-7: 使 用 pgAdmin4 创建 新 数据 库 


创建 角色 、schema 和 其 他 数据 库 对 象 的 步骤 是 类 似 的 ， 都 有 一 些 对 应 的 相关 页 面 供 你 设置 
其 他 属性 。 


2. 权限 管理 

在 PostgreSQL 数据 库 对 象 权限 管理 方面 ， 不 会 有 比 pgAdmin 的 授权 向 导 更 好 的 管理 工具 
了 ， 你 可 以 通过 菜单 栏 上 的 Tools (工具 ) 一 Grant Wizard (授权 向 导 ) 打开 其 页 面 。 如 果 
你 只 需要 对 schema 中 的 对 象 进行 授权 ， 可 以 直接 在 schema 名 字 上 点 击 右键 并 选择 Grant 
Wizard， 打 开 的 页 面 上 只 会 出 现 该 schema 所 拥有 的 对 象 。 如 同 其 他 许多 功能 项 一 样 ， 在 
成 功 连 到 数据 库 之 前 ， 其 菜单 项 一 直 都 是 灰 的 。 另 外 ， 该 菜单 项 对 于 当前 树 状 目录 上 的 焦 
点 位 置 也 很 敏感 ， 点 击 到 不 同位 置 时 ， 该 菜单 项 就 会 显示 出 可 用 或 者 不 可 用 等 不 同 状态 。 
例如 ， 要 为 cesus 这 个 schema 中 的 项 设置 权限 ， 请 在 目录 树 上 选中 此 schema 并 点 开 授权 
向 导 ， 界 面 如 图 4-8 所 示 。 然 后 你 就 可 以 选择 所 有 或 者 部 分 项 ， 然 后 切换 到 Privileges ( 权 
限 ) 选项 卡 上 以 设置 你 想 要 授予 的 角色 和 权限 。 



































pgAdmin 的 使 用 | 71 








上 Languages Grant Wizard - Object Selection (step 1 of 3) 立 jx| | 
上 银 schemas (3) 









































@ census Please select objects from the list below 
Op yp create 上 
© Searlt iy ohject ype or name 
wgin/Group 
2 pewpop om ET 
Re 器 $ Sequence census lu_fact_types_fact_ type_id_seq | 
$$ CREATE Script 
Backup... 国 Table census facts 
他 Restore.. 回 国 Table census hisp_pop 
& Grant Wizard... 口 国 Table census lu_fact_types 
eae 器 国 Table census Iu_tracts 
区 Properties... 


: 
EE [Te] 





图 4-8: pgAdmin4 的 授权 向 导 


除了 为 已 有 对 象 授权 以 外 ， 我 们 日 常 遇 到 更 多 的 一 个 场景 是 为 一 个 schema 或 者 database 中 新 
建 的 对 象 设 置 默认 权限 。 要 执行 此 类 授权 ， 请 右键 单 击 schema 或 者 database 对 象 节点 ， 然 后 
选择 Properties (属性 ) 菜单 项 ， 然 后 在 弹出 的 界面 上 点 击 切 换 到 Default Privileges (默认 权限 ) 
选项 卡 ， 如 图 4-9 所 示 。 


© Schema - census | 


General Secunty Default Prvileges SQL 























Tables ”Sequences Functions Types 









































Default Privileges: Tables 
Grantee Privileges Grantor 
cE 
|]INSERT Dw GRANT OPTION 
SELECT wmH GRANT OPTION 
口 uPoArE ]wrr GRANT OPTION 
- pgrepuser oevere ]wrr GRANT | 2 Eg x 
FTRUNCATE [|WITH GRANT OPTION 
EREFERENCES| |WITH GRANT OPTION 
FTRIGGER [|WITH GRANT OPTION 
































图 4-9: pgAdmin4 的 默认 授权 管理 
当 为 schema 授予 默认 权限 时 ， 请 记得 一 定 要 为 相应 的 组 角色 授予 访问 此 schema 的 权限 。 





4.2.5 ”数据 导入 和 导出 


同 psql 一 样 ，pgAdmin 也 可 以 导入 和 导出 文本 文件 。 


1. 导入 文件 


pgAdmin 的 导入 功能 其 实 是 对 psql 的 \copy 命令 做 了 一 层 封装 ， 并 要 求 导 入 数据 的 目的 表 





必须 已 建 好 。 要 实现 数据 导入 ， 请 在 要 导入 数据 的 表 上 单 击 鼠标 右键 。 图 4-10 显示 了 我 们 





在 Lu_fact_types 表 上 点 击 右键 后 





昌 现 的 界 画 
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om 
Header 
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Specifies the charactert 
row (line) of the fe. The 
format a comma in CSV 
byte characier This opti 
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Not null eolumns |Notnulcolumns 
that separates columns within each \ 


defaultis atab character in text 





Do not matcn the specified column values against the null 
string. In the default case where the null string is empty, this 
means that empty values will be read as zero-length strings 
rather than nulls, even when they are not quoted. This option 
is allowed only inimport and only when using CSV format 


format. This must be a single one 
ion is not allowed when using 





Quote 
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图 4-10: pgAdmin4 的 Import (导入 ) 菜单 


2. 使 用 pgAdmin 将 数据 导出 为 结构 化 文件 或 者 报表 格式 





除了 导入 数据 ， 你 还 可 以 将 查询 结果 导 有 
格式 。pgAdmin4 的 导出 功能 比 pgAdmin 





时。pgAdmin3 支持 导出 为 CSV、HTML 或 者 XML 
3 要 弱 很 多 。 


要 使 用 pgAdmin 导出 分 隔 符 文 本 格式 ， 请 按 以 下 步骤 操作 。 


() 打开 查询 窗口 〈 
(2) 编写 查询 语句 。 
(3) 执行 查询 语句 。 
(4) 如 

图 标 (|) 并 设 定 下 载 目标 位 置 。 
(5) 如果 是 pgAdmin3， 在 跳出 保存 页 
4-11 填写 设置 内 容 。 











总 





























果 是 pgAdmin3， 请 点 击 菜单 栏 上 的 File 一 Export; 如 果 是 pgAdmin4， 请 点 击 下载 


前 会 给 出 一 个 提示 ，pgAdmin4 则 没有 。 按 照 
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科 Export datato file 站 
Row separator Encoding 
LF QD Local charset 
图 cR/LF 人 图 Unicode UTF-8 
Quoting 
Column separator ， 
Ono quoting 
Quote 中 ar ” 图 only strings 
Column names 回 © al columns 
Filename C:\test,csv 闻 
、 














图 4-11: Export (导出 ) 菜单 


导出 为 HIML 或 者 XML 的 步骤 非常 类 似 ， 唯 一 的 差别 在 于 需要 点 击 菜单 栏 上 的 File 一 
Quick Report (快速 报表 ) 选项 ， 参 见 图 4-12。 











Report Tite 
Quid report 


Report Notes 
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WIIndude the SQL in the report? 
Output format 





® XHTML 1.0 Transitional 
© XML 


Stylesheet 


人 图 Embed the default stylesheet 
Embed an external stylesheet (specified file must exist) 


Link to an external stylesheet 


Filename 


Output file c:\test.html 国 











V| Open the output file in the default browser? 

















4-12: 导出 报表 选项 


4.2.6 备份 与 恢复 


pgAdmin 为 pg_dump 和 pg_restore 提供 了 图 形 化 的 操作 界面 ， 相 关 具 体 功能 已 在 2.7 节 中 























介绍 过 。 本 节 内 容 中 ， 我 们 将 重复 使 用 一 些 前 面 已 经 使 用 过 的 例子 ， 不 过 是 使 用 pgAdmin 
来 执行 操作 ， 而 非 使 用 命令 行 。 

如 果 你 的 机 器 上 安装 了 多 个 版 本 的 PostgreSQL 或 pgAdmin， 建 议 你 先 确 认 pgAdmin 指向 
了 正确 版 本 的 PostgreSQL 的 bin 目录 ( 即 pg_dump、pg_restore 等 命令 行 工 具 所 在 的 目 
录 )， 可 以 通过 检查 pgAdmin 的 bin 目录 设置 来 确认 ， 如 图 4-13 所 示 。 























Preferences 





辐 Browser EDB Advanced 


Display Server Binary 
Nodes Path Path to the directory containing the EDB Advanced 


Dhboar Server utility programs (pg_dump, pg_restore etc) 
Graphs 


PostgreSQL 
局 Debugger gresQ $DIR/../runtime 


: Binary Path 
Display Path to the directory containing the PostgreSQL utility 


BB- Miscellaneous programs (pg_dump, pg_restore etc) 
User language 

局. Paths 
Binary paths 
Help 

BB: SQL Editor 
Display 
Explain 
Options 

日 . Storage 
Options 





图 4-13: pgAdmin File 一 Preferences 菜单 











如 果 你 是 在 对 一 台 远 程 服务 器 进行 备份 或 者 恢复 操作 ， 或 者 你 操作 的 数据 库 
数量 特别 庞大 ， 那 么 建议 你 使 用 命令 行 工具 而 不 要 使 用 pgAdmin， 因 为 此 种 
情况 下 操作 过 程 本 来 就 已 经 很 耗 时 ， 使 用 pgAdmin 操作 会 使 得 耗 时 和 复杂 度 
增加 。 另 外 也 请 牢记 : 对 于 pg_dump 转 储 的 自 定义 压缩 格式 、TAR 包 格 式 、 
目录 格式 这 三 种 二 进 制 格式 的 备份 文件 ， 必 须 使 用 与 pg_dump 相同 或 者 更 新 
版 本 的 pg_restore 工具 来 进行 恢复 。 








1. 完整 备份 一 个 database 中 的 数据 

在 2.7.1 节 中 ， 我 们 已 经 演示 了 如 何 完整 备份 一 个 database。 下 面 使 用 pgAdmin 界面 再 演示 
一 遍 操作 过 程 。 请 右键 单 击 待 备份 的 database， 并 选择 Custom ( 自 定义 ) 格式 ， 如 图 4-14 
所 示 。 
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Backup (Database: postgresql_book) | 


General Dump options 


Filename 四 





Format Custom v 
Compression 

ratio 

Encoding UTF8 X 了 
Number of jobs 

Role name Select from the list v 


图 4-14: 备份 database 


2. 备份 系统 级 对 象 

pgAdmin 为 pg_dumpall 提供 了 一 个 图 形 化 界面 ， 用 于 对 系统 对 象 进行 备份 。 要 使 用 该 界 
面 ， 请 先 连 接 到 希望 备份 的 PostgreSQL 服务 器 。 然 后 从 顶部 菜单 中 选择 Tools (工具 ) 
一 Backup Globals (全 局 备份 )。 

pgAdmin 不 支持 指定 备份 哪些 全 局 对 象 ， 但 在 pg_dumpall 的 命令 行 界面 上 是 可 以 的 。 
pgAdmin 默认 会 备份 所 有 的 系统 表 空 间 和 角色 。 

如 果 你 希望 备份 整个 服务 器 端的 所 有 数据 ， 可 以 通过 点 击 菜单 栏 上 的 Tools 一 Backup 
Server (备份 服务 器 ) 来 实现 。 

3. 选择 性 地 备份 部 分 数据 库 对 象 

pgAdmin 为 pg_dump 的 选择 性 备份 功能 提供 了 一 个 图 形 化 接口 。 在 希望 备份 的 数据 库 对 象 
上 右键 单 击 ， 然 后 在 弹出 的 菜单 中 选择 Backup (如 图 4-15 所 示 )。 你 可 以 选择 备份 整个 
database、 一 个 特定 的 schema 或 者 任何 其 他 数据 库 对 象 。 















































日 - 爹 =chemas (5) 
令 census 
© 7 create 上 
© © Refresh... 
© 曾 Delete/Drop 
痊 Drop Cascade 
'Login/Gro CREATE Script 
Tablespad| 
他 Restore... 
Grant Wizard... 
5 Query Tool... 
区 Properties... 














图 4-15: pgAdmin 的 schema 备份 





在 pgAdmin3 中 ， 如 果 和 希望 仅 备份 当前 图 形 界面 上 选中 的 数据 库 对 象 ， 那 么 你 可 以 忽略 备 
份 界面 上 的 其 他 选项 卡 〈 如 图 4-14 所 示 )， 只 用 默认 设置 即 可 。 当 然 ， 你 也 可 以 切换 到 
Objects (对 象 ) 选项 卡 选择 备份 更 多 对 象 ， 如 图 4-16 所 示 。 注 意 该 特性 在 pgAdmin4 中 还 
不 支持 。 

















> 


Database postgresql_book 
克 census 
VM facts 
I¥ hisp_pop 
VY lu_fact types 
VY lu_tracts 
public 
allsubscribers 
Fm interval_periods 
让 kg_users 
Fm logs 
记 logs_2010 
mm logs_2011 
FF logs_2011 01 02 
mm user_facts 
mm web_sessions 
厂 xml_bag 
日 -万 staging 
FF factfinder_import 
万 pop_import 





[a 
[ea 
日 









File Options | Dump Options #1 | Dump Options #2 OQbjects 


Ce Ee EE 











图 4-16: pgAdmin3 的 选择 性 备份 Objects 选项 卡 


pgAdmin 在 后 台 其 实 就 是 调用 了 pg_dump 命令 行 工 具 来 实施 备份 动作 ， 如 采 
你 希望 了 解 pgAdmin 最 终 使 用 的 命令 是 什么 样子 ， 那 么 可 以 在 点 击 Backup 
按钮 开始 执行 备份 后 切换 到 备份 界面 最 右 侧 的 Messages (消息 ) 选项 卡 ， 其 
中 会 记录 系统 自动 生成 的 带 参 数 的 pg_dump 命令 行 。 
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4.3 pgScript 脚 本 机 制 





pgScript 是 pgAdmin3 内 置 的 一 种 脚本 机 制 ，pgAdmin4 还 不 支持 此 特性 。 该 机 制 非常 适合 
于 重复 执行 SQL 任务 的 场景 。 相 比 PostgreSQL 的 国 数 机 制 ，pgScript 对 内 存 的 使 用 更 合 









































机 制 会 将 所 有 工作 在 最 后 一 次 性 批量 提交 ， 此 前 未 提交 的 工作 成 果 都 保存 在 内 存 








理 ， 因 而 执行 效率 更 高 。pgScript 机 制 之 所 以 能 达到 这 种 效果 ， 是 因为 PostgreSQL 函数 


中 。 相 比 


之 下 ，pgScript 在 运行 脚本 时 每 执行 一 条 SQL 语句 就 提交 一 次 ， 这 样 就 使 得 pgScript 特别 
适合 执行 会 消耗 大 量 内 存 而 又 不 需要 作为 一 个 完整 事务 来 提交 的 任务 。 一 旦 某 个 事务 被 
提交 ， 则 该 事务 占用 的 内 存 会 立即 被 释放 ， 这 部 分 内 存 即 可 用 于 下 一 个 事务 。 在 “Using 














pgScript for Geocoding” 这 篇 博文 中 你 可 以 看 到 我 们 所 做 的 示例 。 




















pgScript 脚本 语言 是 一 种 弱 类 型 语言 ( 即 定义 变量 时 无 须 明确 指 定 其 类 型 )， 支 持 条 件 判 
断 、 和 循环、 数据 生成 器 、 基 本 的 打印 函数 以 及 记录 型 变量 ， 其 语法 与 微软 SQL Server 数据 

















库 所 使 用 的 Transact-SQL 语法 类 似 。 前 面 加 @ 的 是 变量 ， 可 以 存放 标量 或 数组 ， 
命令 的 执行 结果 。DECLARE、SET、IF-ELSE、WHILE 等 语法 在 pgScript 中 都 支持 。 
可 以 在 SQL 查询 执行 窗口 中 执行 pgScript。 在 窗口 中 输入 脚本 后 ， 点 击 pgScript 
行 ( 嚼 )。 

下 面 将 演示 一 些 pgScript 脚本 的 例子 。 示 例 4-1 演示 了 如 何 使 用 pgScript 记录 型 变 









































包括 SQL 








图 标 来 执 








量 和 循环 


语法 来 构建 一 个 交叉 表 ， 使 用 的 基础 表 是 lu_fact_types， 该 表 是 我 们 在 示例 7-22 中 创建 
的 。 以 下 pgScript 脚本 中 创建 了 一 个 名 为 census.hisp_pop 的 空 表 ， 该 表 有 以 下 数字 型 列 : 


hispanic_or_latino、white_alone 和 black_or_african_american_alone， 以 及 其 他 一 些 列 。 








示例 4-1 在 pgScript 中 使 用 记录 型 变量 建 表 
DECLARE @I, @labels, @tdef; 
SET @I = 0; 


变量 Labels 将 用 于 存放 记录 
SET @labels = 
SELECT 
quote_ident( 
repLace( 
repLace(Lower(COALESCE(fact_subcats[4]，fact_subcats[3]))， 
it >》 to 1 
) 
) As coL_name， 
fact_type_id 
FROM census.Lu_fact_types 


人 
2 


WHERE category = 'Population' AND fact_subcats[3] ILIKE 'Hispanic or Latino%' 


ORDER BY short_name; 
SET Qtdef = 'census.hisp_pop(tract id varchar(11) PRIMARY KEY '; 


使 用 LINES 函 数 来 循环 遍历 每 一 条 记录 

WHILE QI < LINES(QLabelLs) 

BEGIN 
SET @tdef = @tdef + ', ' + @labels[@I][0] + ' numeric(12,3) '; 
SET @I = @I + 1; 

END 
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SET Qtdef = @tdef + ')'; 


打印 表 def 
PRINT Qtdef; 


创建 表 
CREATE TABLE @tdef; 


尽管 pgScript 中 没有 专门 用 于 执行 动态 SQL 的 命令 ， 但 我 们 可 以 通过 示例 4-1 中 所 示 的 方 
法 来 实现 执行 动态 SQL， 即将 SQL 字符 串 分 配给 某 个 变量 。 我 们 在 示例 4-2 中 更 加 深入 地 
挖掘 了 pgScript 的 功能 ， 该 示例 中 我 们 对 上 面 刚 刚 创建 好 的 census.hisp_pop 表 进 行 了 填 
充 操作 。 


示例 4-2 使 用 pgScript 循环 填充 表 
DECLARE @I, @labels, @tload, @tcols, @fact_types; 
SET @I = 0; 
SET @labels = 
SELECT 
quote_ ident( 
repLace( 
replacel 
lower(COALESCE(fact_subcats[4], fact _ subcats[3])), ' '， 




















) As col_name, 
fact_type_id 
FROM census.luyu_fact types 
WHERE category = 'Population' AND fact_subcats[3] ILIKE 'Hispanic or Latino%' 
ORDER BY short_name; 


SET @tload = 'tract _ id'; 
SET @tcols = 'tract id'; 
SET @fact types = '-1'; 


WHILE @I < LINES(@labels) 
BEGIN 
SET @tcols = @tcols + ', ' + @labels[@I][0] ; 
SET @tload = @tload + 
', MAX(CASE WHEN fact type id= ' + 
CAST(@labels[@I][1] AS STRING) + 
' THEN val ELSE NULL END)'; 
SET @fact types = @fact types + ', ' + CAST(@labels[@I][1] As STRING); 
SET @I = @I + 1; 
END 


INSERT INTO census.hisp_pop(@tcols) 

SELECT QtLoad FROM census .facts 

WHERE fact_type_id IN(CQfact_types) AND yr=2010 
GROUP BY tract_id; 


从 上 面 的 示例 中 可 以 学 到 的 一 点 是 : 可 以 动态 地 往 一 个 变量 中 一 点 点 加 入 SQL 语句 的 零碎 
部 分 ， 最 终 组 成 一 个 完整 的 SQL 语句 。 
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4.4 以 图 形 化 方式 解释 执行 计划 


pgAdmin 最 为 人 称道 的 优秀 功能 之 一 就 是 它 能 够 以 图 形 化 方式 展示 语句 执行 计划 。 打 开 
SQL 语句 执行 窗口 ， 编 写 一 个 SQL 语句 ， 然 后 点 击 “ 解 释 查 询 ” 图 标 (是 ) 就 可 以 看 到 
此 语句 的 执行 计划 图 示 。 


例如 ， 执 行 以 下 查询 : 


SELECT left(tract_id, 5) As county_code, SUM(hispanic or_latino) As tot, 
SUM(white_alone) As tot_white, 
SUM(COALESCE(hispanic_or_latino,0) - COALESCE(white_alone,0)) AS non_white 
FROM census.hisp_pop 
GROUP BY county_code 
ORDER BY county_code; 


我 们 将 看 到 如 图 4-17 所 示 的 图 形 化 解释 。 读 懂 这 种 图 形 化 解释 有 一 个 小 窒 门 ， 那 就 是 尽 可 
能 让 粗 第 头 变 细 ! 第 头 越 粗 ， 说 明 该 步 又 的 执行 时 间 越 长 。 



































之 


census.hisp_pop Sort Aggregate 


Temp Written Blocks 0 

Sort Key ("left“((hisp_pop.tract_id):-text, 5)) 
Node Type Sort 
Sort Space Used 129 
Actual Total Time 0.938 
Shared Hit Blocks 15 
Shared Read Blocks 0 

Local Hit Blocks 0 

Local Dirtied Blocks 0 

Sort Method quicksort 
Plan Width 40 
Actual Loops 1 

Actual Startup Time 0.883 
Temp Read Blocks 0 
Output fleft"(ftract_id)j::text, 5)),hispanic_or_latino,white_alone 
Local Read Blocks 0 

Sort Space Type Memory 
Startup Cost 111.29 
Shared Dirtied Blocks 0 
Shared Written Blocks 0 

Local Written Blocks 0 

Plan Rows 1478 
Parallel Aware false 
Actual Rows 1478 
Parent Relationship ”Outer 
Total Cost 114.98 

















图 4-17: 图 形 化 解释 示例 




















如 果 SQL 语句 执行 器 菜单 栏 上 的 Query (查询 ) 一 Explain (解释 ) 一 Buffers (缓冲 区 ) 
已 启用 ， 那 么 图 形 化 解释 就 会 被 禁用 。 因 此 切记 使 用 图 形 化 解释 时 不 要 启用 该 选项 。 除 了 
图 形 化 解释 之 外 ，Data Output (数据 输出 ) 选项 卡 上 还 会 显示 文本 解释 计划 ， 本 例 中 的 输 











入 后 
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出 如 下 所 示 。 


GroupAggregate (cost=111.29..151.93 rows=1478 width=20) 
Output: ("left"((tract id)::text, 5)), sum(hispanic_or_latino), 
sum(white alone), ... 
-> Sort (cost=111.29..114.98 rows=1478 width=20) 
Output: tract_ id, hispanic or_latino, white_alone, 
("left"((tract id)::text, 5)) 
Sort Key: ("left"((tract_id)::text, 5)) 
-> Seq Scan on census.hisp_ pop (cost=0.00..33.48 rows=1478 width=20) 
Output: tract_ id, hispanic or_latino 
,， White alone, "left"((tract id)::text, 5) 


4.5 使 用 pgAgent 执 行 定 时 任务 


pgAgent 是 PostgreSQL 中 执行 定时 任务 的 得 力 工具 。 同 时 它 也 可 用 于 执行 操作 系统 批 处 理 
脚本 ， 因 此 在 Linux/Unix 系统 中 它 可 取代 crontab; 在 Windows 中 ， 它 可 取代 定时 任务 规 
划 器 。 事 实 上 ，pgAgent 的 定时 任务 功能 远 比 这 里 描述 的 更 强大 : 任何 一 台 机 器 ， 不 管 操 
作 系 统 是 什么 ， 只 要 它 上 面 能 安装 pgAgent， 我 们 就 可 以 在 其 上 执行 定时 任务 。 有 具体 步骤 
是 先 在 这 台 机 器 上 装 好 pgAgent， 然 后 设置 该 pgAgent 连接 到 一 个 PostgreSQL 数据 库 上 ， 
但 需要 该 数据 库 上 预先 安装 好 pgAgent 所 需 的 功能 表 和 函数 。 执 行 定 时 任务 的 机 器 上 不 需 
要 安装 PostgreSQL 服务 端 软件 ， 但 客户 端 数据 库 是 必须 的 ， 因 为 要 保证 pgAgent 能 够 连接 
到 外 部 的 PostgreSQL 服务 器 。pgAgent 是 构建 于 PostgreSQL 架构 基础 上 的 ， 因 此 你 可 以 
通过 控制 服务 端的 表 数 据 来 控制 pgAgent 的 行为 。 例 如 ， 如 果 需 要 将 一 个 复杂 的 定时 任务 
复制 多 次 ， 那 么 你 只 需 直接 登录 到 PostgreSQL 服务 器 并 往 pgAgent 的 表 中 插入 几 条 记录 即 
可 ， 完 全 不 需要 在 pgAmin 界面 上 对 pgAgent 执行 操作 。 


本 节 将 教 你 如 何 使 用 pgAgent。 在 “Setting Up pgAgent and Doing Scheduled Backups” 这 篇 
博文 中 你 可 以 看 到 一 个 真正 实用 的 例子 以 及 设置 细节 。 




































































4.5.1 安装 pgAgent 


你 可 以 从 http://www.pgadmin.org/download/pgagent.php 下 载 pgAgent 的 安装 包 。 在 
Windows 上 ， 你 也 可 以 通过 EnterpriseDB 公司 提供 的 Stackbuilder 软件 和 BigSQL 公司 
的 发 行 包 来 安装 pgAgent。 安 装 包 中 的 SQL 脚本 会 在 postgres 库 中 自动 创建 一 个 名 为 
pgAgent 的 新 shema。 然 后 当 你 通过 pgAdmin 连 到 数据 库 服 务 器 时 ， 可 以 在 目录 树 上 看 到 
一 个 名 为 Jobs 〈 作 业 ) 的 新 节点 ， 如 图 4-18 所 示 。 




















时 - 九 localhost 10 
日 ` 国 Databases (2) 
由 postgres 
由 | postgresql_book 
由 -名 Login/Group Roles 
由 Tablespaces 


[El pgAgent Jobs 


4-18: 安装 了 pgAgent 后 的 pgAdmin4 界面 
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如 果 你 希望 在 其 他 机 器 上 安装 pgAgent 来 执行 定时 任务 ， 仅 需 在 目标 机 器 上 安装 pgAgent 
客户 端 即 可 ， 而 无 须 再 次 执行 pgAgent 自 带 的 SQL 脚本 ， 因 为 这 个 脚本 只 需 在 PostgreSQL 
服务 端 执行 一 次 即 可 。 请 特别 注意 pgAgent 服务 所 使 用 的 操作 系统 账户 的 权限 设置 ， 一 定 
要 确保 每 个 pgAgent 客户 端 实例 都 有 执行 任务 所 需 的 权限 。 


即使 批 处 理 任务 能 以 命令 行 方式 执行 成 功 ， 也 并 不 代表 通过 pgAgent 来 
执行 此 任务 就 一 定 会 成 功 。 这 一 般 是 因为 权限 原因 导致 ，pgAgent 总 是 以 
pgAgent 服务 所 使 用 的 操作 系统 账户 的 身份 执行 规划 的 任务 ， 如 果 此 账户 没 
有 足够 的 权限 来 执行 此 批 处 理 任务 或 者 没有 访问 某 些 必需 路 径 的 权限 ， 那 么 
任务 就 会 失败 。 




















4.5.2 ”规划 定时 任务 


每 个 定时 任务 包含 两 个 组 成 要 素 : 任务 步骤 以 及 执行 计划 。 当 创建 一 个 新 的 任务 时 ， 先 新 
增 一 个 或 者 多 个 任务 步骤 。 图 4-19 是 新 增 / 编辑 任务 步骤 的 界面 。 

































































4-19: pgAdmin 的 分 步 编辑 屏幕 


在 每 一 个 任务 步骤 中 ， 你 可 以 设 定 一 条 SQL 语句 或 者 指定 一 个 shell 脚本 作为 任务 内 容 ， 
甚至 可 以 复制 一 整 段 shell 脚本 作为 任务 内 容 。 


如 果 你 选择 了 使 用 SQL 语句 ， 那 么 连接 类 型 选项 会 变 为 可 用 并 且 默 认 值 会 被 设 为 本 地 ， 这 
种 情况 下 该 任务 步骤 中 的 SQL 会 在 pgAgent 服务 端 所 在 的 PostgreSQL 服务 器 上 执行 ， 并 
使 用 pgAgent 运行 时 使 用 的 用 户 名 和 密码 来 进行 身份 验证 。 另 外 还 需要 指定 pgAgent 在 执 
行 此 任务 时 要 连接 的 目标 database。 界 面 上 有 一 个 下 拉 列 表 供 你 选择 具体 的 database。 如 果 
你 选择 了 连接 到 远 端 数据 库 服务 器 ， 那 么 供 输入 连接 字符 串 的 文本 框 会 变 为 可 用 状态 。 请 
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在 此 框 中 输入 完整 的 连接 字符 串 ， 包 括 用 于 身份 验证 的 信息 以 及 要 连接 的 目标 database。 
如 果 你 连 到 一 个 早期 版 本 的 远 端 PostgreSQL 数据 库 ， 请 确保 要 执行 的 SQL 语句 的 语法 在 
该 老 版 本 的 PostgreSQL 上 是 支持 的 。 


如 果 你 选择 了 执行 批 处 理 任务 ， 那 么 其 语法 必须 符合 执行 此 任务 的 操作 系统 的 要 求 。 例 
如 ， 如 果 pgAgent 运行 于 Windows 环境 下 ， 那 么 批 处 理 任 务 脚本 必须 是 合法 的 DOS 命令 
行 脚本 ， 如 果 pgAgent 运行 于 Linux 环境 ， 那 么 批 处 理 任务 脚本 必须 是 合法 的 shell 脚本 。 


多 个 任务 步骤 之 间 是 以 其 名 称 的 字母 顺序 来 排序 并 执行 的 。 你 可 以 指定 每 个 步骤 执行 完毕 
后 的 处 理 方式 : 如 果 该 步骤 执行 成 功 则 如 何 处 理 ， 如 果 该 步骤 执行 失败 又 如 何 处 理 。 你 可 
以 选择 禁用 某 些 步骤 而 不 删除 它们 ， 因 为 你 以 后 可 能 会 重新 用 上 这 些 步骤 。 
任务 步骤 设 定 好 之 后 ， 你 就 可 以 设 定 执行 计划 来 执行 这 些 步 又 了 。 通 过 执行 计划 页 面 你 上 
以 设 定 极为 复杂 的 执行 策略 ， 你 甚至 可 以 设置 多 个 执行 计划 。 

如 果 你 在 多 台 机 器 上 安装 了 pgAgent， 而 这 些 pgAgent 都 连 到 同一 个 pgAgent 服务 端 数据 
库 ， 那 么 默认 情况 下 所 有 这 些 pgAgent 会 执行 数据 库 中 记录 的 所 有 计划 任务 。 

如 果 你 希望 某 个 计划 任务 只 在 某 台 特定 的 机 器 上 执行 ， 那 么 可 以 在 创建 计划 任务 时 将 页 面 上 
的 host agent (主机 代理 ) 字段 设置 为 希望 执行 此 计划 任务 的 目标 主机 名 。 这 样 其 他 机 器 上 
的 pgAgent 会 发 现 此 计划 任务 的 目标 主机 名 与 自己 所 在 主机 名 不 符 ， 从 而 忽略 此 任务 。 


pgAgent 包含 两 部 分 数据 : 定义 任务 的 数据 以 及 任务 执行 日 志 。 这 些 任务 

志 会 记录 在 pgAgent 这 个 schema 中 ， 而 pgAgent schema 一般 隶属 于 
postgres 数据 库 。pgAgent 进程 会 查询 待 执 行 的 任务 信息 以 决定 接 下 来 执行 
什么 任务 ， 然 后 在 执行 过 程 中 把 相关 的 任务 日 志 信 息 写 入 数据 库 中 。 一 般 来 
说 ， 用 于 承载 这 两 类 数据 的 PostgreSQL 服务 器 和 pgAgent 是 运行 于 同一 台 服 
务 器 上 的 ， 但 并 不 是 必须 如 此 ， 二 者 可 以 分 离 部 署 。 此 外 ， 一 台 PostgreSQL 
服务 器 可 以 服务 于 很 多 部 署 在 不 同 主机 上 的 pgAgent。 













































































一 个 完整 的 定时 任务 看 起 来 如 图 4-20 所 示 。 





日 .号 pgAgent jobs (1) 
日 -项 Maintenance 
日 -网 schedules (1) 
© Daily 
日 -图 steps (1) 
Vacuum tables 








4-20: pgAdmin 界面 上 的 pgAgent 定时 任务 
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4.5.3 一些 有 用 的 pgAgent 相 关 查 询 语 名 


如 果 你 SQL 技术 高 超 ， 那 么 完全 可 以 通过 直接 修改 pgAgent 的 元 数据 表 来 实现 对 定时 任务 
的 复制 、 删 除 和 修改 。 只 是 在 修改 时 要 特别 小 心 谨慎 ， 不 要 搞 错 ! 例如 ， 要 想 查看 控制 着 
pgAgent 和 定时 任务 具体 行为 的 后 台 表 内 容 ， 只 需 连 到 postgres 数据 库 并 执行 示例 4-3 中 
的 查询 。 


示例 4-3 ”查询 pgAgent 相关 表 的 描述 信息 

SELECT c.reLname As table_name, d.description 

FROM 
pg_class As c INNER JOIN 
pg_namespace n ON n.oid = c.relnamespace INNER JOIN 
pg_description As d ON d.objoid = c.oid AND d.objsubid = 0 

WHERE n.nspname = 'pgagent'" 

ORDER BY c.relname; 





| 
+ 
pga_job | Job main entry 
pga_jobagent | Active job agents 
| 
| 
| 
| 
| 


pga_jobclass Job classification 
pga_joblog Job run logs. 
pga_jobstep Job step to be executed 
pga_jobsteplog | Job step run logs. 
pga_schedule Job schedule exceptions 


尽管 在 pgAdmin 中 制定 pgAgent 定时 任务 和 观察 其 执行 日 志 的 界面 已 经 非常 直观 易 懂 ， 但 
如 果 你 设置 了 很 多 定时 任务 或 者 你 希望 查看 自己 的 定时 任务 执行 结果 总 览 ， 那 么 就 需要 生 
成 自己 的 定时 任务 执行 报告 。 示 例 4-4 演示 了 我 们 在 此 情况 下 经 常会 使 用 的 一 个 查询 语句 。 
示例 4-4 列 出 从 今天 开始 的 定时 任务 执行 结果 
SELECT j.jobname，s.jstname，L.jsLstart,L.jsLduration，L.jsLoutput 
FROM 
pgagent .pga_jobstepLog As L INNER JOIN 
pgagent .pga_jobstep As s ON s.jstid = \.jsljstid INNER JOIN 
pgagent.pga_job As j ON j.jobid = s.jstjobid 
WHERE jsLstart > CURRENT_DATE 
ORDER BY j.jobname, s.jstname, l.jslstart DESC; 


有 时 候 定时 任务 即使 失败 了 也 会 报 成 功 ， 因 为 pgAgent 并 不 总 能 准确 判断 shell 脚本 的 执行 
结果 到 底 是 成 功 还 是 失败 。 日 志 中 的 jstloutput 字段 提供 shell 输出 ， 该 输出 通常 会 详细 说 
明 哪 里 出 现 了 错误 。 


在 Windows 平台 上 ， 有 若干 个 版 本 的 pgAgent 经 常会 把 事实 上 已 执行 成 功 的 
shell 脚本 的 执行 结果 判定 为 执行 失败 。 如 果 你 遇 到 了 这 种 情况 ， 那 么 应 该 把 
任务 步骤 的 结果 处 理 方式 设 定 为 “错误 时 忽略 ”"。 这 是 一 个 已 知 的 bug， 我 们 
希望 在 将 来 的 版 本 中 能 够 尽快 修复 。 
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数据 类 型 





与 其 他 所 有 数据 库 一 样 ，PostgreSQL 也 支持 数字 型 、 字 符 串 型 、 日 期 型 、 时 间 型 以 及 布尔 
型 等 业界 常用 的 数据 类 型 。 但 PostgreSQL 的 先进 之 处 在 于 它 还 支持 数组 、 带 时 区 的 日 期 时 
间 、 时 间 间 隔 、 区 间 、JSON、XML 以 及 其 他 很 多 数据 类 型 ， 此 外 还 支持 用 户 自 定义 数据 
类 型 。 本 章 不 会 一 一 介绍 PostgreSQL 支持 的 所 有 数据 类 型 ， 如 果 你 需要 了 解 的 话 ， 请 自行 
参考 官方 手册 。 我 们 将 着 重 介绍 PostgreSQL 独 有 的 若干 数据 类 型 ， 以 及 在 通用 数据 类 型 方 
面 PostgreSQL 与 其 他 数据 库 有 哪些 细微 差异 。 


如 果 离 开 了 相应 的 函数 和 运算 符 ， 数 据 类 型 将 完全 无 用 武之 地 。PostgreSQL 为 各 种 数据 类 型 提 
供 了 功能 强大 、 种 类 丰富 的 原生 函数 和 运算 符 支 持 。 本 章 将 介绍 一 些 使 用 比较 广泛 的 类 型 。 


我 们 所 说 的 函数 是 指 f(x) 这 种 形式 的 函数 ， 我 们 所 说 的 “运算 符 ” 是 指 一 些 
符号 性 的 运算 符号 ， 比 如 +、-、*、/， 具 体 可 分 为 需要 单个 参数 的 一 元 运算 
符 和 需要 两 个 参数 的 二 元 运算 符 。 当 使 用 运算 符 时 ， 请 记 住 它 在 面 对 不 同 的 
数据 类 型 时 所 代表 的 含义 是 不 同 的。 比如 加 号 对 数字 来 说 就 是 相 加 ， 对 区 间 
类 型 来 说 就 是 区 间 的 并 集 。 















































5.1 数值 类 型 
PostgreSQL 支持 常用 的 整数 、 小 数 、 浮 点 数 等 数字 类 型 。 本 市 想 重 点 介绍 的 是 serial 类 
型 以 及 一 个 灵活 实用 的 整数 序列 生成 函数 。 


5.1.1 serial 类 型 
serial 类 型 和 它 的 兄弟 类 型 bigserial 是 两 种 可 以 自动 生成 递增 整数 值 的 数据 类 型 一般 
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如 果 表 本 身 的 字段 不 适合 作为 主键 字段 ， 会 增加 一 个 专门 的 字段 并 指定 为 serial 类 型 以 
作为 主键 。 在 不 同 的 数据 库 产 品 中 这 种 数据 类 型 有 着 不 同 的 称呼 ， 一 般 最 常见 的 叫 法 是 
autonumber。 创 建 表 时 如 果 指 定 了 一 个 字段 类 型 为 serial， 那 么 PostgreSQL 会 首先 将 其 作 
为 整 型 处 理 ， 同 时 自动 在 该 表 所 在 schema 中 创建 一 个 名 为 table_name_column_name_seq 的 
序列 。 然 后 设 定 该 序列 为 该 整 型 字段 的 取 值 来 源 。 如 果 修 改 了 表 定 义 并 删除 此 serial 字 
段 ， 那 么 系统 同时 也 会 自动 删除 附属 的 序列 。 


在 PostgreSQL 中 ， 序 列 自身 就 是 一 种 数据 库 资 产 。 可 以 通过 pgAdmin 图 形 界面 或 者 ALTER 
SEQUENCE 语句 来 管理 该 类 对 象 。 可 以 设置 其 当前 值 和 边界 值 (也 就 是 最 大 值 和 最 小 值 )， 
还 可 以 设置 每 次 递增 的 步 长 。 虽 然 一 般 来 说 序列 值 都 是 递增 的 ， 但 你 也 可 以 将 其 设 为 递 
减 ， 只 要 将 步 长 值 increment 设 为 负数 即 可 。 作 为 一 种 独立 的 数据 库 资产 ， 你 可 以 通过 
CREATE SEQUENCE 命令 来 创建 序列 ， 还 可 以 在 多 张 表 间 共 用 一 个 序列 。 如 果 需 要 生成 一 个 跨 
越 多 表 的 唯一 键 值 ， 那 么 这 种 多 表 共 享 序列 的 用 法 特别 方便 。 

如 需 多 表 共 享 同 一 个 现存 的 序列 号 生成 器 ， 先 为 每 张 表 新 增 一 个 类 型 为 integer 或 者 
bigint 的 字段 ， 然 后 指定 其 默认 值 为 nextval(sequence_name) 即 可 ,语法 如 示例 5-1 所 示 。 
示例 5-1 在 新 表 上 使 用 现存 的 序列 号 生成 器 


CREATE SEQUENCE s START 1; 
CREATE TABLE stuff(id bigint DEFAULT nextval('s') PRIMARY KEY, name text); 






























































如 果 你 重 命名 了 一 张 含 serial 字段 的 表 ， 这 张 表 的 serial 字段 关联 的 序列 
号 生成 器 是 不 会 跟着 改名 的 ， 但 关联 运作 机 制 是 不 受 影响 的 。 为 避免 混 请 ， 
可 以 手动 修改 序列 号 生成 器 的 名 称 以 保持 与 表 名 一 致 。 








5.1.2 ”生成 数组 序列 的 函数 

PostgreSQL 有 一 个 名 为 generate_series 的 灵活 又 实用 的 数组 生成 函数 ， 目 前 为 止 我 们 还 
没 发 现 有 哪 种 数据 库 支持 类 似 功能 。 该 函数 支持 两 种 使 用 形式 。 它 可 以 用 来 生成 一 个 按 一 
定 步 长 递增 的 整数 序列 ， 也 可 以 用 来 生成 一 个 以 一 定时 间 间 隔 作为 步 长 来 递增 的 日 期 或 者 
时 间 惟 序列 。generate_series 函数 的 方便 之 处 在 于 ， 你 可 以 使 用 它 有 效 地 模仿 SQL 中 的 
for 循环 。 示例 5-2 演示 了 如 何 生成 一 个 整数 序列 。 示 例 5-13 演示 了 如 何 生成 时 间 序 列 。 
示例 5-2 使 用 可 选 的 步 长 参数 来 生成 整数 序列 。 


示例 5-2 使 用 generate_series() 函数 生成 步 长 为 13 的 整数 序列 


SELECT x FROM generate series(1,51,13) As x; 





如 果 不 输入 步 长 ， 则 默认 步 长 为 1。 如 示例 5-2 所 示 ， 你 可 以 传人 一 个 可 选 的 步 长 参数 来 
彰 定 对 于 每 个 后 续 元 素 要 跳 过 多 大 的 步 长 。 另 外 请 注意: 结束 值 将 永远 不 会 超出 我 们 指定 
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的 区 间 ， 因 此 ， 尽 管 我 们 的 区 间 结 束 于 $1， 但 最 后 一 个 数字 是 40， 因 为 40 再 加 上 13 就 
会 超出 上 限 。 


5.2 文本 类 型 


PostgreSQL 有 三 种 最 基础 的 文本 数据 类 型 : character (也 称 为 char)、character varying 
(也 称 为 varchar) 和 text。 


仅 当 需 要 存储 邮政 编码 、 电 话 号 码 以 及 美国 的 社会 保险 号 等 定 长 字符 串 时 ， 才 应 使 用 char 
类 型 。 如 果 存 储 的 字符 长 度 达 不 到 char 类 型 的 定义 长 度 ， 那 么 PostgreSQL 会 自动 在 后 面 
用 空格 填充 ， 直 到 填 满 定义 的 长 度 为 止 。 相 比 varchar 或 者 text，char 的 右 补 齐 空格 机 
制 会 导致 存储 空间 的 浪费 ， 得 到 的 好 处 是 可 以 确保 字符 串 是 定 长 的 。 可 以 确认 的 是 ，char 
比 起 varchar 和 text 没有 任何 性 能 优势 ， 却 一 定 会 占用 更 多 的 空间 。 如 果 要 存储 变 长 字 
符 串 ， 请 使 用 varchar 类 型 。 当 为 表 定 义 varchar 类 型 的 字段 时 ， 应 为 其 设置 最 大 长 度 。 
text 类 型 是 最 通用 的 字符 存储 类 型 ， 不 需要 设 最 大 长 度 。 


varchar 类 型 的 最 大 长 度 其 实 是 可 选 的 。 如 果 不 设 定 的 话 ，varchar 与 text 几乎 没有 任何 
区 别 ， 但 当 通 过 一 些 特定 的 驱动 连 到 PostgreSQL 时 ， 二 者 还 是 能 表现 出 一 些微 小 的 差异 。 
比如 ，ODBC 驱动 可 以 对 varchar 字段 进行 排序 ， 却 不 支持 text 类 型 的 排序 。varchar 和 
text 类 型 字段 的 存储 空间 上 限 均 为 约 1GB ， 这 是 一 个 很 大 的 值 了 。 事 实 上 ， 系 统 在 后 台 会 
用 TOAST 机 制 处 理 超 过 一 个 物理 存储 页 大 小 的 内 容 。 


有 人 认为 应 该 彻底 废弃 varchar 并 完全 转 用 text， 关 于 这 一 点 ， 业 界 一 直 有 着 不 同 的 声 
音 。 此 处 不 会 浪费 篇 幅 争 论 此 问题 ， 请 参考 “In Defense of Varchar(X)” 这 篇 博文 以 了 解 这 
场 争论 的 详情 。 


有 时 候 ， 为 了 保持 跨 平台 应 用 的 兼容 性 ， 需 要 使 字符 串 类 型 的 操作 变 得 不 区 分 大 小 写 。 要 
实现 此 目标 ， 需 要 重 写 那些 区 分 大 小 写 的 比较 运算 符 。 相 比 text， 对 varchar 进行 运算 符 


重 写 要 更 容易 一 些 。 我 们 在 “Using MS Access with PostgreSQL” 这 篇 博文 中 ， 演 示 了 如 何 
使 varchar 类 型 变 得 不 区 分 大 小 写 而 且 还 能 够 用 上 索引 。 


5.2.1 字符 串 函 数 
常见 的 字符 串 操作 包括 : 填充 (Lpad、rpad)、 修 整 空 白 (rtrim、1ltrim、trim、btrim)、 
提取 子 字符 串 (substring) 以 及 连接 〈|11)。 示 例 5-3 演示 了 填充 操作 ， 示 例 5-4 演示 了 修 
整 空白 操作 。 
示例 5-3 使 用 Lpad 和 rpad 进行 填充 操作 
SELECT 
lpad('ab', 4, s ab_lpad, 


rpad('ab', 4, s ab_rpad, 
lpad('abcde', 4, '0') As ab_lpad trunc; © 
































































































































0')A 
0')A 


ab_lpad | ab_rpad | ab_lpad_trunc 
Se i 
00ab | ab00 | abcd 
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@ 如 果 字 符 串 超过 指定 长 度 ，Lpad 不 但 不 会 填充 ， 反 而 会 对 其 进行 截断 。 


默认 情况 下 ，trin 国 数 用 于 移 除 空格 ， 但 你 也 可 以 传人 一 个 可 选 参数 ， 指 示 要 剪裁 的 其 他 
字符 。 
示例 5-4 ”剪裁 空格 和 字符 
SELECT 
a As a_before，trim(a) As a_trim，Frtrim(a) As a_rt， 
i As i before, ltrim(i, '0') As i 1t 0， 
rtrim(i, '0') As i rt 0, trim(i, '0') As i t 0 


FROM ( 
SELECT repeat(' ', 4) || i || repeat(' ', 4) As a, '0' || iAs i 
FROM generate_series(0, 200, 50) As i 
) As Xx; 
a_before | a_trim | a_rt | i before | i lt 0 |irto|ito 
------------- +--------+---------+----------+--------+--------+------- 
0 | 0 | 9 | 90 | | | 
50 | 50 | 50 | 050 | 50 | 65 | 5 
100 | 100 | 100 | 0100 | 100 | 01 | 1 
150 | 150 | 150 | 0150 | 150 | 615 | 15 
200 | 200 | 200 | 0200 | 200 | 02 | 2 


有 一 个 很 有 用 的 字符 串 操 作 国 数 string_agg， 我 们 已 在 示例 3-14 中 展示 了 其 用 法 ， 你 还 将 
在 示例 5-26 中 再 次 见 到 它 。 


5.2.2 ”将 字符 串 拆 分 为 数组 、 表 或 者 子 字符 串 
PostgreSQL 中 有 一 些 函 数 可 以 对 字符 串 进行 拆 分 操作 。 


split_part 国 数 可 以 将 指定 位 置 的 元 素 从 用 固定 分 隔 符 分 隔 的 字符 串 中 取出 来 ， 如 示例 
5-5 所 示 。 这 里 我 们 取出 用 圆 点 分 隔 的 字符 串 中 的 第 二 个 元 素 。 


示例 5-5 ”取出 分 隐 符 字符 串 中 的 第 个 元 素 


SELECT split part('abc.123.z45','.', 2) As X; 























123 
string_to_array 国 数 可 以 将 基于 固定 分 隔 符 的 字符 串 拆 分 为 一 个 数组 。 通 过 结合 使 用 
string_to_array 和 unnest 函数 ， 可 以 将 一 个 字符 串 展开 为 若干 记录 行 ， 如 示例 5-6 所 示 。 
示例 5-6 ”将 基于 固定 分 隔 符 格式 的 字符 串 展开 为 记录 行 


SELECT unnest(string_to_array('abc.123.z45', '.')) As x; 








5.2.3 正则 表达 式 和 模式 匹配 
PostgreSQL 对 正则 表达 式 的 支持 是 极其 强大 的 。 
数组 ， 并 且 对 其 进行 极其 复杂 的 替换 和 更 新 操作 。 
些 高 级 搜索 方法 都 是 支持 的 。 本 节 将 提供 一 个 小 型 























你 可 以 设 定 查 询 返 回 结果 的 格式 为 表 或 者 
包括 逆向 引用 (back reference) 在 内 的 一 
的 示例 以 说 明 这 些 内 容 。 如 需 了 解 更 多 相 


关 人 信息， 请 参考 PostgreSQL 官方 手册 中 的 “模式 匹配 ”和 “字符 串 函 数 ” 这 两 节 的 内 容 。 
示例 5-7 展示 了 如 何 对 以 数字 形式 存储 的 电话 号 码 进行 格式 化 操作 。 
示例 5-7 ”使 用 逆向 引用 技术 对 电话 号 码 进行 重新 格式 化 











SELECT regexp_repLace( 
"6197306254 ' ， 
'([0-9]{3})([0-9]{3})([0-9]{4})', 
E'\(\1\) \\2-\\3 

) As x; 


(619) 730-6254 








\\1L 和 \\2 是 模式 匹配 表达 式 中 的 元 素 。 我 们 使 月 


有 反 斜 村 (\) 来 转 义 圆 括号 ， 表 示 此 处 是 

















真 的 要 作为 一 个 圆 括号 来 用 。E' 是 PostgreSQL 日 











个 表达 式 ， 其 中 类 似 \ 的 特殊 字符 应 该 按照 字面 含义 来 处 理 。 





的 特有 语法 ， 表 示 后 续 跟 着 的 字符 串 是 一 














些 号 码 提取 出 来 并 作为 记录 行 输出 。 
示例 5-8 将 文本 中 的 电话 号 码 作为 单独 的 行 返 


SELECT unnest(regexp_matches( 
'Cell (619) 852-5083. Work (619)123-4567 ， 





可 





假设 一 个 字符 串 中 内 舱 了 一 些 电话 号 码 ， 示 例 5-8 演示 了 如 何 仅 通过 一 个 SQL 语句 就 将 这 


Casa 619-730-6254. Besame mucho.', 


E'[(]{t9,1}[9-9]j{3}[)-.]{t9,1}[\\s]j{t9,1}[9-9]j{3}[-.]{t9,1}[9-9]{4} ， 9 ) 


) As x; 


(619) 852-5083 
(619)123-4567 
619-730-6254 
(3 rows) 


示例 5-8 中 用 到 的 匹配 规则 如 下 所 示 。 


。 [(]{9,1}: 开始 是 0 个 或 者 1 个 (。 
。 [9-9]{3}: 跟着 3 位 数字 。 
。 [)-.]{9,1}: 跟着 0 个 或 者 1 个 )、- 或 者 .。 
。 [9-9]{4}: 跟着 4 位 数字 。 
。 regexp_matches 国 数 会 返回 根据 一 个 正则 表达 

















式 筛 选 匹 配 得 到 的 字符 串 数组 。 该 函数 的 


最 后 一 个 人 参 名 为 flags， 我 们 为 其 输入 的 值 是 9，9 代表 global， 即 需要 进行 完整 搜索 



































并 返回 所 有 匹配 上 的 字符 串 ， 每 个 字符 串 作 为 数组 中 的 一 个 元 素 。 如 果 不 填 该 flags 参 


数 ， 那 么 返回 的 结果 只 会 包含 第 一 个 命中 的 字符 串 。 请 注意 ，flLags 参数 中 可 以 包含 多 
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个 标记 。 例 如 ， 如 果 你 的 正则 表达 式 中 含有 一 些 字符 ， 你 又 希望 在 做 正则 匹配 时 不 区 分 
这 些 字符 的 大 小 写 〈 即 不 管 大 小 写 都 命中 ) ， 同 时 还 希望 返回 所 有 匹配 上 的 字符 串 而 不 
仅仅 返回 第 一 个 ， 那 么 可 以 用 gi 这 个 复合 标记 。 除 此 以 外 还 支持 其 他 一 些 标 记 ， 完 整 
的 列表 可 以 从 官方 手册 的 “POSIX 标准 中 的 幅 入 式 选项 ”部 分 查 到 。 


。 unnest 函数 将 一 个 数组 分 解 为 一 个 行 集 。 


同一 个 正则 表达 式 可 以 有 多 种 写法 。 比 如 ，\\d 代表 [9-9]。 但 我 们 建议 不 
要 为 了 省 那儿 个 字符 而 把 表达 式 搞 得 太 星 涩 难 懂 ， 应 该 采用 更 加 容易 理解 的 





写法 。 








如 果 只 需要 命中 第 一 条 ， 那 么 可 以 使 用 substring 函数 ， 如 示例 5-9 所 示 。 


示例 5-9 ”从 一 段 文 本 中 查找 第 一 个 电话 号 码 
SELECT substring( 


'Cell (619) 852-5083. Work (619)123-4567 , Casa 619-730-6254. Besame mucho.' 
from E'[(]{0,1}[0-9]{3}[)-.]{0,1}[\\s]{0,1}[0-9]{3}[-.]{0,1}[0-9]{4}') 


AS x; 


(619) 852-5083 
(1 row) 


除了 正则 表达 式 专用 的 那些 函数 外 ， 你 还 可 以 将 正则 表达 式 与 SIMILAR T0 (~) 运算 符 一 
起 使 用 。 以 下 查询 可 以 查 出 所 有 内 上 骨 了 电话 号 码 的 description 字段 : 





SELECT description 
FROM mytable 
WHERE description ~ 


E'[(]{0,1}[0-9]{3}[)-.]{0,1}[\\s]{0,1}[0-9]{3}[-.]{0,1}[0-9]{4}"; 


5.3 ”时间 类 型 


PostgreSQL 对 时 间 类 型 的 支持 在 业界 是 无 人 能 及 的 。 除 了 常见 的 日 期 和 时 间 类 型 ， 





PostgreSQL 还 支持 时 区 ， 并 能 够 按照 不 同 的 时 区 对 夏令 时 进行 


自动 转换 。 此 外 PostgreSQL 





还 支持 一 些 特殊 的 数据 类 型 ， 如 interval， 该 类 型 可 以 用 于 对 日 期 时 间 进 行 数学 运算 。 
PostgreSQL 还 有 正 无 穷 大 和 人 负 无 穷 大 的 概念 ， 这 样 我 们 就 不 用 为 了 表达 这 两 个 概念 而 和 弄 出 








一 些 奇 奇怪 怪 的 潜 规 则 ， 搞 这 些 潜 规则 迟早 会 导致 问题 。 区 间 类 型 可 以 表达 时 间 区 间 的 概 
念 ， 并 且 提 供 了 大 量 与 区 间 运 算 相关 的 运算 符 、 函 数 和 索引 。5.5 节 中 会 详细 介绍 该 类 型 。 
在 最 新 的 版 本 中 ，PostgreSQL 支持 9 种 与 时 间 相 关 的 数据 类 型 。 理 解 这 些 类 型 之 间 的 区 
别 很 重要 ， 否 则 你 就 无 法 为 不 同业 务 场景 选择 适用 的 数据 类 型 。 除 了 range 类 型 外 ， 其 他 
所 有 类 型 都 遵循 ANSI SQL 标准 。 业 界 的 其 他 数据 库 最 多 支持 这 些 类 型 中 的 一 部 分 而 非 所 
有 。Oracle 支持 的 类 型 最 多 ，SQL Server 其 次 ，MySQL 又 次 之 。 


PostgreSQL 的 每 种 时 间 类 型 都 有 其 独特 之 处 。 对 于 其 中 支持 时 区 的 类 型 ， 如 果 数 据 库 服务 
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器 所 在 的 时 区 发 生 了 改变 ， 则 该 类 型 中 存储 的 数据 会 自动 针对 新 的 时 区 进行 调整 以 保证 时 

间 一 致 。 接 下 来 对 它们 进行 更 详细 的 介绍 。 

date 
该 类 型 仅 存储 月 、 日 、 年 ， 没 有 时 区 、 小 时 、 分 和 秒 的 信息 。 

time ( 叉 称 time without time zone) 
该 类 型 仅 存储 小 时 、 分 、 秒 信息 ， 不 带 日 期 和 时 区 信息 。 

timestamp (又 称 timestamp without time zone) 
该 类 型 存储 了 日 期 (年 、 月 、 日 ) 和 时 间 (时 、 分 、 秒 ) 数据 ， 但 不 带 时 区 信息 。 因 
此 ， 即 使 你 修改 了 数据 库 服务 器 所 在 的 时 区 信息 ， 该 类 字段 查询 出 来 显示 的 值 也 是 固定 
不 变 的 。 

timestamptz ( 叉 称 timestamp with time zone) 
该 类 型 同时 存储 了 日 期 、 时 间 以 及 时 区 信息 。 在 系统 内 部 ， 该 类 型 的 字段 值 是 以 UTC 
世界 标准 时 间 格 式 存储 的 ， 但 当 查 询 显示 时 ， 会 按照 服务 器 的 时 区 设置 进行 换算 后 再 显 
示 (时 区 也 可 以 在 库 级 /用 户 级 /会 话 级 分 别 进行 设置 ) 。 如 果 你 输入 的 时 间 改 不 带 时 区 
数据 ， 那 么 在 入 timestamptz 类 型 字段 中 时 ，PostgreSQL 会 自动 使 用 当前 数据 库 服务 器 
的 时 区 信息 来 补充 。 如 果 修 改 了 数据 库 服 务 器 的 时 区 设置 ， 你 可 以 看 到 查询 出 来 的 时 间 
数据 发 生 了 变化 。 

timetz 〈 又 称 time with time zone) 
与 timestamptz 类 型 类 似 ， 但 该 类 型 的 使 用 频率 较 低 ， 因 为 它 虽然 携带 了 时 区 信息 却 没 
有 日 期 信息 。 该 类 型 永远 假设 当前 时 间 是 夏令 时 。 有 的 编程 语言 不 支持 这 种 仅 有 时 间 而 
无 日 期 的 数据 类 型 ， 因 此 可 能 会 将 其 自动 转换 为 带 时 区 的 时 间 惟 类 型 ， 转 换 时 日 期 就 取 
计算 机 系统 时 间 的 初始 值 〈 例 如 ，Unix 时 间 纪 元 起 始 于 1970 年 ， 因 此 转换 后 的 日 期 就 
是 1970 年 1 月 1 日 ， 时 区 和 时 间 不 变 ， 夏令 时 )。 

interval 
该 类 型 描述 了 一 个 时 间 段 的 长 度 ， 单 位 可 以 是 小 时 、 天 、 月 、 分 钟 或 者 其 他 粒度 。 该 类 
型 适用 于 对 日 期 和 时 间 进 行 数学 运算 的 场景 。 例 如 ， 假 设 从 现在 开始 666 天 之 后 世界 就 
会 灭亡 ， 那 么 你 在 现在 的 时 刻 上 加 上 长 度 为 666 天 的 一 个 intervat 类 型 值 ， 就 可 以 知 
道 世界 灭亡 的 准确 时 刻 。 

tsrange 
该 类 型 可 用 于 定义 timestamp with no timezone 的 开 区 间 和 闭 区 间 。 该 类 型 包含 两 个 时 间 
惟 以 及 开 区 间 和 闭 区 间 限 定 符 。 例 如 ，'[2012-01-01 14:00 2012-01-01 15:00)'::tsrange 
定义 了 从 14:00 开始 到 15:00 之 前 结束 的 一 个 时 间 段 。 请 参考 PostgreSQL 官方 手册 中 “区 
间 类 型 ”一 节 以 了 解 更 多 信息 。 

tstzrange 
该 类 型 可 用 于 定义 timestamp with timezone 的 开 区 间 和 闭 区 间 。 


daterange 


该 类 型 可 用 于 定义 日 期 的 开 区 间 和 闭 区 间 。 
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5.3.1 时 区 详解 


PostgreSQL 中 有 众多 支持 时 区 的 数据 类 型 ， 关 于 它们 有 一 个 常见 的 误解 ， 就 是 认为 
PostgreSQL 会 在 日 期 和 时 间 类 型 的 基础 上 额外 增加 一 个 标记 来 标识 时 区 。 这 种 理解 是 错误 
的 。 如 果 你 存储 了 这 么 一 个 带 时 区 的 信息 : 2612-2-14 18:08:00-8 (-8 代表 比 UTC 时 间 述 
8 小 时 的 时 区 ) ，PostgreSQL 内 部 其 实 是 这 么 工作 的 : 


(1) 通过 计算 得 到 2012-02-14 18:08:00-8 代表 的 UTC 标准 时 间 ， 就 是 2012-02-15 04:08:00-0; 
(2) 把 上 述 计算 得 到 的 UTC 标准 时 间 存 储 下 来 。 
当 你 回调 该 数据 以 用 于 显示 时 ，PostgreSQL 内 部 是 这 样 运作 的 : 


(1) 以 字段 内 容 中 指定 的 时 区 作为 后 续 计算 的 基础 时 区 ， 如 未 指定 ， 则 用 数据 库 服务 器 上 本 
置 的 默认 时 

(2) 计算 该 时 区 相对 于 UTC 标准 时 间 的 时 差 (对 于 America/New_York 时 区 来 说 ， 与 UTC 
的 时 差 是 -5 小 时 ) ， 

(3) 根据 UTC 标准 时 间 和 时 区 的 时 差 计算 出 当地 时 间 (2012-02-15 16:08:00 加 上 时 差 -5 小 
时 后 得 到 2012-02-15 21:08:00) ， 

(4) 显示 计算 结果 (2012-02-15 21:08:00)。 


可 以 看 到 ，PostgreSQL 并 没有 存储 时 区 信息 ， 而 只 是 使 用 时 区 信息 来 把 日 期 和 时 间 转 换 为 
UTC 标准 时 间 再 存储 下 来 。 此 后 就 不 需要 时 区 信息 了 。 当 PostgreSQL 需要 显示 该 日 期 时 
间 信 息 时 ， 它 会 按 顺序 查找 当前 会 话 级 、 用 户 级 、 数 据 库 级 、 服 务 器 级 的 时 区 设置 ， 然 后 
使 用 找到 的 第 一 个 时 区 来 将 UTC 标准 时 间 转 换 为 对 应 时 区 的 时 间 值 后 再 显示 。 如 果 你 使 
用 了 带 时 区 信息 的 数据 类 型 ， 请 务必 了 解 将 服务 器 从 一 个 时 区 搬迁 到 另 一 个 时 区 的 后 果 。 
假设 你 的 数据 库 服务 器 起 初 在 纽约 ， 然 后 你 将 其 数据 拿 到 洛杉矶 做 了 恢复 ， 那 么 所 有 带 时 
区 信息 的 日 期 和 时 间 数 据 看 起 来 都 会 不 一 样 了 。 这 乍 看 起 来 有 点 怪 ， 但 其 实 是 正常 的 ， 你 
务必 要 预见 到 这 种 情况 的 发 生 。 


下 面 将 演示 一 个 时 区 处 理 不 当 导 致 问题 的 例子 。 假 设 麦 当 苑 公司 的 服务 器 都 部 署 在 东海 
岸 ， 服 务 器 中 记录 了 各 门店 的 开门 营业 时 间 ， 并 且 是 用 timetz 格式 存储 的 。 然 后 旧金山 开 
了 一 家 新 的 麦当劳 分 店 ,分 店 经 理 给 麦当劳 总 部 打 电 话 ， 要 求 把 新 店 的 信息 纳入 总 部 的 管 
理 数据 库 ， 并 标记 其 开门 营业 时 间 为 早上 7 点 。 于 古 位 于 东海 岸 的 数据 库 服 务 器 中 会 记录 
下 该 分 店 的 营业 时 间 为 早上 7 点 ， 但 这 个 时 间 转 换 到 旧金山 当地 时 区 却 是 凌晨 4 点 。 于 是 
旧金山 很 多 早起 的 人 就 会 很 奇怪 ， 为 什么 明明 说 是 凌晨 4 点 开门 却 到 了 时 间 还 没 营业 。 买 
不 到 早点 是 小 事 ， 但 你 可 以 想象 这 三 小 时 的 时 差 能 导致 多 么 大 的 混乱 ， 这 甚至 可 能 导致 人 
命 关 天 的 问题 。 


看 了 上 面 的 例子 ， 你 可 能 会 问 : 既然 这 么 危险 ， 为 什么 还 要 使 用 带 时 区 的 时 间 类 型 ? 原因 
有 以 下 儿 个 。 首 先 ， 这 些 类 型 能 够 自动 执行 时 区 转换 ， 从 而 避免 了 繁琐 的 手工 劳动 。 例 
如 ， 某 航空 公司 的 某 个 航班 早上 8 点 从 波士顿 出 发 ，11 点 到 达 洛 杉 矶 ， 但 是 该 公司 的 数据 
库 服务 器 位 于 欧洲 ， 如 果 这 些 时 间 入 库 时 都 要 手工 计算 时 差 后 再 录入 ， 那 就 效率 太 低 了 。 
使 用 了 支持 时 区 的 数据 类 型 后 ， 只 需 孙 入 带 时 区 信息 的 波士顿 和 洛杉矶 本 地 时 间 即 可 。 另 
一 个 使 用 带 时 区 的 数据 类 型 的 理由 是 其 能 够 自动 处 理 夏令 时 。 世 界 各 国 对 于 夏令 时 的 规定 
五 花 八 门 ， 如 果 某 个 数据 库 可 能 会 被 全 球 各 地 的 应 用 访问 ， 那 么 就 需要 及 时 按照 最 新 的 全 
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球 夏 令 时 规定 来 更 新 库 中 的 时 间 信 息 。 手 动 跟 踪 全 球 夏令 时 的 变化 是 一 件 无 比 繁琐 的 工 
作 ， 这 需要 一 个 全 职 的 程序 员 来 专门 收集 各 国 的 夏令 时 安排 ， 并 在 前 述 数据 库 中 刷新 这 些 
国家 (地区) 的 相关 时 间 数 据 。 


这 里 有 一 个 非常 有 趣 的 例子 : 一 位 出 差 中 的 销售 员 需 要 坐 飞机 回 家 ， 起 点 是 旧金山 ， 终 点 
是 奥克兰 附近 。 当 她 登 上 飞机 时 ， 妆 地 时 钟 显示 的 时 间 是 2012 年 3 月 11 日 凌晨 1 点 50 
分 。 当 她 降落 时 ， 当 地 时 钟 显示 的 时 间 是 2012 年 3 月 11 日 凌晨 3 点 10 分 。 那 么 请 问 这 
段 旅程 共 花 了 多 长 时 间 ? 要 回答 这 个 问题 有 一 个 关键 点 ， 那 就 是 在 这 段 飞 行 的 过 程 中 发 生 
了 夏令 时 的 转换 ， 也 就 是 说 时 间 向 前 跃迁 了 。 如 果 使 用 了 带 时 区 信息 的 时 间 惟 ， 算 出 来 的 
时 间 间 隔 就 是 20 分 钟 ， 对 于 一 段 仅仅 跨越 旧金山 海 湾 的 短途 飞行 来 说 ， 这 个 答案 显然 是 
可 信和 的 。 如 果 我 们 不 使 用 带 时 区 信息 的 数据 类 型 ， 一 定 会 得 到 错误 的 答案 。 

SELECT '2012-03-11 3:10 AM America/Los_Angeles'::timestamptz 

- '2012-03-11 1:50 AM America/Los_Angeles'::timestamptz; 


以 上 查询 得 到 的 答案 是 20 分 钟 ， 然 而 以 下 查询 得 到 的 答案 却 是 1 小 时 20 分 钟 。 

SELECT '2012-03-11 3:10 AM' ::timestamp- '2012-03-11 1:50 AM'::timestamp; 
我 们 再 举 几 个 例子 来 把 这 个 问题 讲 得 更 透彻 一 些 。 如 示例 5-10 所 示 ， 我 输入 时 使 用 的 是 带 
时 区 的 洛杉矶 本 地 时 间 ， 但 由 于 数据 库 服 务 器 位 于 波士顿 ， 所 以 查询 时 输出 的 时 间 是 带 时 
区 信息 的 波士顿 本 地 时 间 。 请 注意 ， 输 出 显示 附带 了 时 差 ， 这 是 没 问题 的 ， 与 我 原始 录入 
的 时 间 之 间 仅 仅 是 显示 差异 而 已 ， 在 数据 库 系 统 内 部 是 以 UTC 标准 时 间 存 储 的 。 
示例 5-10 输入 时 使 用 的 是 一 个 时 区 的 本 地 时 间 ， 输 出 却 是 另 一 个 时 区 的 本 地 时 间 


SELECT '2012-02-28 10:00 PM America/Los_Angeles'::timestamptz; 












































x 








2012-02-29 01:00:00-05 

在 示例 5-11 中 ， 我 们 要 求 返 回 的 是 不 带 时 区 的 时 间 惟 。 因 此 这 个 查询 在 全 世界 任何 地 方 的 
数据 库 服务 器 上 执行 都 会 返回 相同 的 结果 。 
示例 5-11 将 带 时 区 信息 的 时 间 惟 数据 转换 为 不 带 时 区 的 时 间 改 数据 


SELECT "2012-02-28 10:00 PM America/Los_Angeles'::timestamptz 
AT TIME ZONE 'Europe/Paris'; 











2012-02-29 07:00:00 


以 上 查询 其 实 回答 了 这 人 么 一 个 问题 : 洛杉矶 本 地 时 间 2012-02-28 10:00 p.m. 对 巴黎 来 说 是 
当地 时 间 几 点 ? 请 注意 ， 查询 结果 是 不 带 相 对 于 UTC 标准 时 间 的 时 差 的 。 另 外 请 注意 ， 
可 以 通过 官方 名 称 而 非 UTC 时 差 来 指定 一 个 时 区 ， 可 以 访问 维基 百科 来 查看 所 有 时 区 的 
官方 名 称 (http://en.wikipedia.org/wiki/Tz_database ) 。 


5.3.2 日 期 时 间 类 型 的 运算 符 和 函数 
时 间 间 隔 (interval) 类 型 的 引入 极 大 简化 了 PostgreSQL 中 日 期 和 时 间 类 型 的 数学 运算 过 


程 。 如 果 没 有 interval 类 型 ， 我 们 就 得 专门 创建 一 堆 函 数 来 实现 这 些 运算 功能 ， 很 多 其 他 
数据 库 就 是 这 么 干 的 。 通 过 interval 类 型 ， 可 以 使 用 我 们 很 熟悉 的 加 减 运 算 符 对 日 期 和 时 
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间 进 行 相 加 或 者 相 减 操作 。 下 面 的 例子 展示 了 可 用 于 日 期 和 时 间 类 型 的 运算 符 和 函数 。 
相 加 运算 符 (+) 可 以 在 一 个 时 间 类 型 值 上 加 上 一 段 时 间 间 隔 : 
SELECT '2012-02-10 11:00 PM'::timestamp + interval '1 hour'; 


2012-02-11 00:00:00 


你 也 可 以 将 两 个 interval 类 型 直接 相 加 : 
SELECT '23 hours 20 minutes'::interval + '1 hour'::interval; 
24:20:00 

相 减 运算 符 (-) 可 以 从 一 个 时 间 类 型 值 中 减 去 一 段 时 间 间 隔 : 
SELECT '2012-02-10 11:00 PM'::timestamptz - interval '1 hour ; 
2012-02-10 22:00:00-05 


示例 5-12 中 展示 了 区 间 重 又 运算 符 OVERLAPS 的 用 法 ， 如 果 两 个 参与 运算 的 时 间 段 有 重 爱 ， 
那么 判定 结果 就 是 true。 这 是 ANSI SQL 标准 中 规定 的 运算 符 ， 其 效果 等 价 于 overlaps 国 
数 。OVERLAPS 谓词 运算 符 需 要 四 个 形 参 ， 前 两 个 是 第 一 个 时 间 段 的 首尾 时 间 点 ， 后 两 个 是 
第 二 个 时 间 段 的 首尾 时 间 点 。0VERLAPS 运算 符 会 将 这 两 个 时 间 段 看 作 半 开 半 闭 区 间 ， 也 就 
是 说 起 始 时 点 包含 在 时 段 内 ， 结 束 时 点 不 包含 在 时 段 内 。 这 与 BETWEEN 谓词 运算 符 的 逻辑 
是 不 一 样 的 ，BETNEEN 会 认为 起 始点 和 结束 点 都 是 包含 在 区 间 内 的 。 只 要 你 设置 的 时 间 段 
的 起 始 时 点 和 结束 时 点 不 相同 〈 如 果 相 同 的 话 就 意味 着 时 间 段 长 度 为 0， 也 就 是 说 时 间 段 
变 成 了 一 个 时 间 点 )， 这 个 差异 就 不 会 造成 什么 问题 。 如 果 你 经 常 需要 使 用 OVERLAPS 运算 
符 ， 请 务必 广 意 这 一 点 。 
示例 5-12 ”对 时 间 惟 和 日 期 类 型 使 用 OVERLAPS 运算 符 
SELECT 

('2012-10-25 10:00 AM'::timestamp, '2012-10-25 2:00 PM'::timestamp) 

OVERLAPS 

('2012-10-25 11:00 AM'::timestamp,'2012-10-26 2:00 PM'::timestamp) AS x, 

('2012-10-25'::date,'2012-10-26'::date) 

OVERLAPS 

('2012-10-26'::date,'2012-10-27'::date) As y; 









































除了 普通 运算 符 和 谓词 运算 符 以 外 ，PostgreSQL 还 支持 一 些 时 间 类 型 的 函数 。 你 可 以 从 
PostgreSQL 官方 手册 的 “日 期 和 时 间 类 型 的 相关 函数 和 操作 ”一 节 中 查 到 完整 的 函数 列 
表 ， 我 们 在 此 仅 演示 一 个 例子 。 


我 们 再 次 用 到 了 用 途 广 泛 的 generate_series 范 数 。 你 可 以 对 日 期 时 间 类 型 使 用 此 函数 ， 
此 时 应 使 用 interval 类 型 值 作为 步 长 。 

如 示例 5-13 所 示 ， 可 以 用 本 地 日 期 时 间 格 式 来 输入 日 期 ， 也 可 以 使 用 在 国际 上 更 为 通用 
的 ISO 格式 “yyyy-mm-dd” 来 输入 日 期 。PostgreSQL 会 自动 识别 不 同 的 输入 格式 。 为 保 
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险 起 见 ， 我 们 倾向 于 使 用 ISO 标准 格式 ， 因 为 在 不 同文 化 中 日 期 的 惯用 格式 是 不 一 样 的 。 
由 于 本 地 设置 的 差异 ， 在 数据 库 服务 器 之 间 甚 至 是 数据 库 实 例 之 间 也 会 存在 这 种 日 期 格式 
差异 。 


实例 5-13 使 用 generate_series() 函数 来 生成 时 间 序 列 数 组 
SELECT (dt - interval '1 day')::date As eom 
FROM generate_series('2/1/2012', '6/30/2012', interval '1 month') As dt; 


2012-01-31 
2012-02-29 
2012-03-31 
2012-04-30 
2012-05-31 


另 一 种 经 稼 使 用 的 操作 就 是 从 日 期 和 时 间 类 型 的 数值 中 抽取 出 一 部 分 。 在 PostgreSQL 中 ， 
联 用 date_part 和 to_char 函数 可 以 实现 此 目标 。 示 例 5-14 中 除了 演示 这 两 个 函数 的 用 法 
外 ， 还 演示 了 带 时 区 信息 的 日 期 时 间 类 型 在 发 生 夏 令 时 变换 时 的 转换 逻辑 ， 为 此 我 们 特地 
挑选 了 一 个 美国 东部 时 区 (US/East) 中 横 跨 夏令 时 变化 点 的 时 间 段 。 夏 令 时 从 凌晨 2 点 生 
效 ， 因 此 该 表 的 最 后 一 行 就 是 夏令 时 变化 以 后 的 新 时 间 。 
示例 5-14 从 日 期 时 间 类 型 中 提取 部 分 元 素 

SELECT dt, date _ part('hour',dt) As hr, to_char(dt,'HH12:MI AM') As mn 

FROM 

generate_series( 

'2012-03-11 12:30 AM ' ， 


"2012-03-11 3:00 AM ' ， 
intervaL '15 minutes 























) As dt; 

dt | hr | mn 
a i 
2012-03-11 00:30:00-05 | 0 | 12:30 AM 
2012-03-11 00:45:00-05 | 0 | 12:45 AM 
2012-03-11 01:00:00-05 | 1 | 01:00 AM 
2012-03-11 01:15:00-05 | 1 | 01:15 AM 
2012-03-11 01:30:00-05 | 1 | 01:30 AM 
2012-03-11 01:45:00-05 | 1 | 01:45 AM 
2012-03-11 03:00:00-04 | 3 | 03:00 AM 





generate_series 国 数 默认 生成 的 是 timesatamptz 类 型 的 数据 ， 需 要 显 式 转换 为 timestamp 


5.4 数组 类 型 


数组 在 PostgreSQL 中 扮演 着 重要 的 角色 。 它 在 构造 聚集 函数 、 形 成 IN 和 ANY 子 句 、 承 载 
数据 类 型 转换 过 程 中 生成 的 中 间 值 等 领域 发 挥 着 重要 作用 。 在 PostgreSQL 中 ， 每 种 数据 
类 型 都 有 相应 的 以 其 为 基础 的 数组 类 型 。 如 果 你 自 定义 了 一 个 数据 类 型 ， 那 么 PostgreSQL 
会 在 后 人 台 自 动 为 此 类 型 创建 一 个 数组 类 型 。 例 如 ，integer 有 一 个 相应 的 整数 数组 类 型 
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integer[]，character 也 有 相应 的 字符 数组 类 型 character[] ， 以 此 类 推 。 下 面 将 展示 一 些 
可 以 快速 构造 出 数组 的 函数 ， 可 以 免除 你 一 个 个 元 素 录 入 的 麻烦 。 此 外 还 有 一 些 用 于 管理 
数组 的 函数 。 你 可 以 从 PostgreSQL 官方 手册 的 “数组 函数 和 运算 符 ” 一 节 中 查 到 全 部 的 数 
组 函数 和 运算 符 列表 。 


5.4.1 数组 构造 函数 
最 基本 的 构造 数组 的 方法 就 是 一 个 个 元 素 手 动 录入 ， 话 法 如 下 : 
SELECT ARRAY[2001， 2002， 2003] As yrs; 
如 果 数 组 元 素 存 在 于 一 个 查询 返回 的 结果 和 集 中， 那么 可 以 使 用 这 个 略 复 杂 一 些 的 构造 函数 
array() 来 生成 数组 : 


SELECT array( 

SELECT DISTINCT date_part('year', log_ts) 

FROM Logs 

ORDER BY date_part('year', log_ts) 

); 
尽管 array 函数 仅 能 用 于 将 单字 段 的 查询 结果 集 转换 为 数组 ， 但 你 依然 可 以 指定 一 个 复合 
数据 类 型 作为 查询 结果 ， 这 种 情况 下 可 以 获得 多 列 结果 。5.8.6 市 会 演示 该 用 法 。 


你 可 以 把 一 个 直接 以 字符 串 格 式 书写 的 数组 转换 为 一 个 真正 的 数组 ， 语 法 如 下 : 


SELECT '{Alex,Sonia}'::text[] As name, '{46,43}'::smallint[] As age; 


















































{Alex,Sonia} | {46,43} 
你 还 可 以 用 string_to_array 国 数 将 一 个 用 固定 分 隔 符 分 隔 的 字符 串 转 换 为 数组 ， 如 示例 
5-15 所 示 。 
示例 5-15 ”将 一 个 分 隔 符 格式 的 字符 串 转 换 为 数组 


SELECT string_to_array('ca.ma.tx', '.') As estados; 




















estados 


{CA, MA, TX} 
(1 row) 


array_agg 是 一 种 聚合 函数 ， 它 可 用 于 将 一 组 任何 类 型 的 数据 转换 为 数组 ， 如 示例 5-16 所 示 。 
示例 5-16 array_agg 国 数 的 使 用 


SELECT array_agg(Log_ts ORDER BY Log_ts) As x 
FROM Logs 
WHERE Log_ts BETWEEN "2011-01-01' : :timestamptz AND '2011-01-15'::timestamptz; 





{'2011-01-01', '2011-01-13', '2011-01-14'} 


在 PostgreSQL 9.5 中 ，array_agg 函数 新 增 了 支持 数组 型 数据 作为 人 参 这 一 能 力 。 在 此 前 














的 版 本 中 ， 如 果 你 试图 通过 array_agg 将 一 批 数 组 聚合 为 二 维 数组 ， 它 会 报错 说 不 支持 。 
array_agg 支持 数组 型 入 参 这 一 能 力 使 得 根据 一 维 数组 构建 出 多 维 数组 成 为 一 件 很 容易 的 
事情 ， 如 示例 5-17 所 示 。 
示例 5-17 根据 一 维 数组 构建 多 维 数 组 

SELECT array_agg(f.t) 


FROM ( VALUES ('{Alex,Sonia}'::text[]), 
('{46,43}'::text[] ) ) As f(t); 

















array_agg 


{{Alex,Sonia}, {46,43}} 

(1 row) 
不 过 要 想 使 用 该 功能 ， 被 聚合 的 基础 数组 中 的 元 素 类 型 必须 相同 ， 而 且 被 聚合 的 基础 数组 
的 维度 必须 一 样 。 为 了 保证 这 一 点 ， 在 示例 5-17 中 ， 我 们 对 其 中 的 年 龄 数组 做 了 类 型 转 
换 ， 统 一 为 text。 另 外 也 可 以 看 到 ， 上 面 例子 中 竺 聚合 的 基础 数组 中 的 元 素 个 数 都 是 相同 
的 : 两 个 人 名 ， 两 个 年 龄 。 如 果 一 批 数组 中 每 个 数组 的 内 部 元 素 个 数 都 相同 ， 则 这 一 批 数 
组 可 以 称 为 平衡 数组 。 


5.4.2 ”将 数组 元 素 展开 为 记录 行 

另外 一 个 常用 的 数组 操作 函数 是 unnest， 通 过 它 可 以 将 数组 元 素 纵向 展开 成 一 个 包含 若干 
条 记录 的 结果 集 ， 如 示例 5-18 所 示 。 

示例 5-18 使 用 unnest 函数 将 数组 纵向 展开 


SELECT unnest('{XOX,0X0,XOX}'::char(3)[]) As tic tac_toe; 








tic_tac_toe 
XOX 
OX0O 
XOX 


你 可 以 在 一 个 SELECT 语句 中 使 用 多 个 unnest 函数 ， 但 如 果 每 个 unnest 展开 后 的 记录 行 3 
不 一 致 ， 或 者 说 “对 不 齐 "， 那 么 得 到 的 最 终结 果 将 是 这 些 结果 集 之 间 的 笛 卡 儿 积 ， 看 起 
来 不 太 好 理解 。 


示例 5-19 演示 了 一 个 unnest 展开 后 可 对 齐 的 结果 集 ， 也 就 是 说 每 个 unnest 都 输出 3 行 记 
录 ， 最 终 连接 成 的 记录 也 是 3 行 。 
示例 5-19 多 个 可 对 齐 数组 的 展开 效果 

SELECT 


unnest('{three,blind,mice}'::text[]) As t, 
unnest('{1,2,3}'::smallint[]) As i; 














[i 
a 十 - 
three |1 
blind |2 
mice |3 
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如 果 你 从 上 述 一 个 数组 中 拿 掉 一 个 元 素 ， 那 么 两 个 数组 的 元 素 就 无 法 对 齐 了 ， 此 时 展开 得 
到 的 结果 如 示例 5-20 所 示 。 
示例 5-20 ”多 个 无 法 对 齐 的 数组 展开 后 的 效果 

SELECT 


unnest( '{blind,mouse}'::varchar[]) As v， 
unnest('{1,2,3}'::smallint[]) As i; 


PostgreSQL 9.4 中 ，unnest 函数 支持 了 多 个 人参, 该 函数 会 在 数组 不 平衡 的 位 置 ' 填 入 空 值 
null。 新 的 unnest 的 主要 缺点 是 ， 它 只 能 用 在 FROM 子 句 中 。 示 例 5-21 使 用 了 刚刚 介绍 过 
的 PostgreSQL 9.4 新 支持 的 unnest， 重 新 展开 了 示例 5-20 中 展开 过 的 不 平衡 数组 。 

示例 5-21 使 用 支持 多 人参 的 unnest 展开 不 平衡 数组 


SELECT * FROM unnest('{blind,mouse}'::text[], '{1,2,3}'::int[]) AS f(t,i); 








mouse 
<NULL> 


5.4.3 ”数组 的 拆 分 与 连接 
PostgreSQL 支持 使 用 start:end 语法 对 数组 进行 拆 分 。 操 作 结果 是 原 数组 的 一 个 子 数 
组 。 例 如 ， 如 果 要 得 到 一 个 仅 包含 当前 数组 第 2 个 至 第 4 个 元 素 的 新 数组 ， 可 以 使 用 
以 下 语法 : 

SELECT fact_subcats[2:4] FROM census.lu fact types; 
如 果 要 将 两 个 数组 连接 到 一 起 ， 可 以 使 用 连接 运算 符 ||: 

SELECT fact_subcats[1:2] || fact_subcats[3:4] FROM census.lu_fact_ types; 
可 以 通过 下 面 的 语法 来 为 一 个 现 有 数组 添加 元 素 : 


SELECT '{1,2,3}'::integer[] || 4 11 5; 








Ea 


























得 到 的 结果 是 {1,2,3,4,5}。 














注 1: 如 果 某 个 数组 相对 其 他 数组 来 说 元 素 个 数 少 ， 则 缺少 的 那些 元 素 的 位 置 就 是 不 平衡 的 位 置 。 
一 一 详 者 注 
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5.4.4 引用 数组 中 的 元 素 


一 般 来 说 ， 我 们 会 通过 数组 下 标 来 引用 数组 元 素 ， 请 特别 注意 PostgreSQL 的 数组 下 标 从 1 
开始 。 如 果 你 试图 越界 访问 一 个 数组 ， 也 就 是 说 数组 下 标 已 经 超过 了 数组 元 素 的 个 数 ， 那 
么 不 会 返回 错误 ， 而 是 会 得 到 一 个 空 值 NULL。 下 面 的 例子 演示 了 获取 数组 的 第 一 个 和 最 后 
一 个 元 素 的 方法 : 
SELECT 
fact_subcats[1] AS primero, 


fact_subcats[array_upper(fact_subcats, 1)] As segundo 
FROM census.Lu_fact_types; 


我 们 使 用 array_upper 函数 来 获取 数组 元 素 的 个 数 ， 该 函数 的 第 二 个 必 选 入 参 表示 数组 的 
维度 。 在 本 例 中 ， 数 组 是 一 维 的 ， 但 PostgreSQL 支持 多 维 数 组 。 


5.4.5 ”数组 包含 性 检查 


PostgreSQL 支持 多 种 数组 类 型 的 运算 符 。 前 面 已 经 见 过 了 连接 运算 符 (||)， 它 可 以 将 多 
个 数组 合并 为 一 个 ， 也 可 以 为 现 有 数组 添加 新 元 素 ， 详 见 5.4.3 市 。 此 外 ， 数 组 类 型 的 运 
算 符 还 有 =、<>、<、>、@>、<@ 以 及 &&。 这 些 运算 符 要 求 两 边 数 组 的 数据 类 型 相同 。 如 果 
你 在 数组 类 型 的 字段 上 建立 了 GiST 或 者 GIN 索引 ， 那 么 这 些 运算 符 可 以 用 上 索引 。 


重合 判定 运算 符 (&&) 的 作用 是 : 如 果 两 个 数组 有 任何 共同 的 元 素 ， 则 返回 true， 否 则 返 
回 false。 示 例 5-22 将 查 出 我 们 表 中 所 有 满足 “fact_subcats 数组 字段 中 含有 0CCUPANCY 
STATUS 或 者 是 For rent 这 两 个 值 中 的 一 个 ”这 一 条 件 的 记录 。 


示例 5-22 数组 重合 判 定 运算 符 
SELECT fact_subcats 
FROM census .Lu_fact_types 
WHERE fact_subcats && '{OCCUPANCY STATUS ,For rent}'::varchar[]; 






































fact_subcats 


{S01,"OCCUPANCY STATUS" , "TotaL housing units"...} 
{S02,"OCCUPANCY STATUS" , "TotalL housing units"...} 
{S03,"OCCUPANCY STATUS" , "TotalL housing units"...} 
{S10,"VACANCY STATUS" , "Vacant housing units","For rent"...} 
(4 rows) 


只 有 当 两 个 数组 中 的 所 有 元 素 及 其 排列 顺序 都 完全 相同 时 ， 等 值 判定 运算 符 (=) 才 会 返 
回 true。 如 有 果 你 并 不 关心 两 个 数组 的 元 素 顺 序 是 否 完全 相同 ， 只 是 想 知道 一 个 数组 中 的 元 
素 集合 是 否 是 另 一 个 数组 的 子 集 ， 可 以 使 用 包含 关系 判定 运算 符 〈@>、<@) 。 示 例 5-23 中 
演示 了 包含 (@>) 和 被 包含 (<@) 这 两 个 运算 符 的 区 别 。 

示例 5-23 数组 包含 关系 判定 运算 符 


SELECT '{1,2,3}'::int[] @> '{3,2}'::int[] AS contains; 





























contains 
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(1 row) 
SELECT '{1,2,3}'::int[] <@ '{3,2}'::int[] AS contained_by; 


contained_by 


(1 row) 


5.5 区 间 类 型 


区 间 数 据 类 型 可 以 表达 一 个 带 有 起 始 值 和 结束 值 的 值 区 间 。PostgreSQL 为 区 间 类 型 提供 了 
很 多 配套 的 运算 符 和 国 数 ， 例 如 判定 区 间 是 否 重 登 ， 判 定 某 个 值 是 否 落 在 区 间 内 ， 以 及 将 相 
邻 的 若干 区 间 合 并 为 一 个 完整 的 区 间 等 。 在 出 现 区 间 类 型 之 前 ， 类 似 操 作 只 能 通过 写 函数 实 
现 ， 这 种 操作 很 敬 琐 ， 不 仅 低 效 而 且 很 容易 出 错 ， 并 且 写 出 的 函数 不 一 定 能 达到 预想 的 效 
果 ， 在 对 于 时 间 类 型 的 操作 中 尤其 如 此 。 在 我 们 自己 的 项 目 中 ， 我 们 在 所 有 需要 表示 时 间 范 
围 的 表 中 都 用 上 了 区 间 类 型 ， 事 实证 明 效果 很 好 。 我 们 希望 你 也 能 分 享 我 们 这 一 成 功 经 验 。 
有 了 区 间 类 型 后 ， 就 不 再 需要 用 两 个 字段 来 定义 一 个 区 间 。 假 设 我 们 希望 定义 一 个 大 于 等 
于 一 小 于 2 的 整数 区 间 ， 该 区 间 的 写法 是 [-2,2)， 左 边 中 括号 表示 左边 是 闲 区 间 ， 即 值 
域 包含 -2;， 右边 小 括号 表示 右边 是 开 区 间 ， 即 值 域 不 包含 2。 那 么 [-2,2) 这 个 整数 区 间 包 
含 的 元 素 有 : -2，-1，0，1。 类 似 地 ， 可 以 知道 以 下 整数 区 间 所 包含 的 元 素 。 

。 整数 区 间 (-2,2] 含 四 个 元 素 : -1、0、1、2。 

。 整数 区 间 (-2,2) 含 三 个 元 素 : -1、6、1。 

。 整数 区 间 [-2,2] 含 五 个 元 素 : -2、-1、6、1、2。 


5.5.1 离散 区 间 和 连续 区 间 


PostgreSQL 对 离散 区 间 和 连续 区 间 是 区 别 对 待 的。 整数 类 型 或 者 日 期 类 型 的 区 间 是 离散 区 
间 ， 因 为 区 间 内 每 一 个 值 都 是 可 以 被 枚 举 出 来 的 。 数 字 区 间或 者 时 间 避 区 间 就 是 一 个 连续 
区 间 ， 因 为 区 间 内 的 值 有 无 限 多 。 

一 个 离散 区 间 有 多 种 表示 方法 ， 比 如 前 面 提 到 的 [-2,2) 这 个 例子 ， 它 就 可 以 换 用 多 种 写法 而 
且 每 种 方式 的 效果 完全 一 样 : [-2,1]、(-3,1]、(-3,2) 和 [-2,2)。 这 四 种 写法 中 ，PostgreSQL 
规定 [-2,2) 为 规范 写法 ， 并 不 是 因为 这 种 写法 有 什么 优势 ， 仅 仅 是 因为 统一 后 有 利于 运算 ， 
不 用 每 次 计算 时 都 得 先 考虑 是 开 区 间 还 是 闭 区 间 这 件 事 。PostgreSQL 会 自动 对 所 有 的 离散 
区 间 进 行规 范 化， 不 管 是 存储 还 是 显示 时 都 会 这 么 做 。 因 此 ， 如 果 你 输入 了 一 个 时 间 区 间 
(2014-1-5,2014-2-1]， 那 么 PostgreSQL 会 自动 把 它 改写 为 [2014-01-06,2014-02-02)。 


5.5.2 原生 支持 的 区 间 类 型 
PostgreSQL 原生 支持 六 种 区 间 类 型 ， 都 是 关于 数字 型 和 日 期 时 间 型 的 。 


int4range、int8range 


这 是 整数 型 离散 区 间 ， 其 定义 符合 前 闭 后 开 的 规范 化 要 求 。 









































































































































numrange 
这 是 连续 区 间 ， 可 以 用 于 描述 小 数 、 浮 点 数 或 者 双 精 度数 字 的 区 间 。 
daterange 
这 是 不 带 时 区 信息 的 日 期 离散 区 间 。 
tsrange、 tstzrange 
这 是 时 间 蕉 (日 期 加 时 间 ) 类 型 的 连续 区 间 ， 秒 值 部 分 支持 小 数 。tsrange 不 带 时 区 信 
息 ，tstzrange 带 时 区 信息 。 
对 于 数字 类 型 的 区 间 来 说 ， 如 果 区 间 的 起 点 值 或 者 终点 值 未 指定 ， 那 么 PostgreSQL 会 自动 
为 其 填 入 nutll 值 。 理 论 上 讲 ， 你 可 以 将 该 null 解释 为 代表 左 侧 的 -infinity ( 负 无 穷 ) 或 
右 侧 的 infinity ( 正 无 穷 )。 实 际 上 ， 你 会 受 限 于 特定 数据 类 型 的 最 小 值 和 最 大 值 。 比 如 
对 于 int4range 数据 类 型 来 说 ， 区 间 (,) 实际 上 代表 的 是 [-2147483648,2147483647)。 
对 于 时 间 类 型 的 区 间 来 说 ，-infinity 和 infinity 就 是 有 效 的 上 限 和 下 限 。 


除了 系统 原生 支持 的 区 间 类 型 外 ， 你 还 可 以 自 定 义 区 间 类 型 ， 可 以 设 定 为 离散 区 间 也 可 以 
设 定 为 连续 区 间 。 


5.5.3 定义 区 间 的 方法 
任何 类 型 的 区 间 都 是 由 相同 数据 类 型 的 起 点 值 和 终点 值 外 加 表示 区 间 开 闭 的 符号 [、]、 
(、) 构成 的 ， 如 示例 5-24 所 示 。 
示例 5-24 使 用 类 型 转换 的 方法 来 定义 区 间 
SELECT '[2013-01-05,2013-08-13]'::daterange; @ 
SELECT '(2013-01-05,2013-08-13]'::daterange; @ 


SELECT '(0,)'::int8range; © 
SELECT '(2013-01-05 10:00,2013-08-13 14:00]'::tsrange; @ 






































[2013-01-05,2013-08-14) 
[2013-01-06,2013-08-14) 
[1,) 
("2013-01-05 10:00:00","2013-08-13 14:00:00"] 
@ 定义 了 一 个 从 2013-01-05 到 2013-08-13 的 日 期 型 闭 区 间 。 请 注意 此 处 区 间 终 点 的 写法 
是 不 规范 的 。 
@ 定义 了 一 个 从 2013-01-05 到 2013-08-13 的 日 期 型 半 开 半 闭 区 间 。 请 注意 此 处 区 间 起 点 
和 终点 的 写法 都 是 不 规范 的 。 
日 定义 了 一 个 大 于 0 的 整数 区 间 。 请 注意 此 处 区 间 起 点 的 写法 是 不 规范 的 。 
@ 定义 了 一 个 从 2013-01-05 10:00 AM 到 2013-08-13 2 PM 的 半 开 半 闭 连续 区 间 。 























PostgreSQL 中 的 日 期 时 间 类 型 可 以 用 -infinity 表示 负 无 穷 ， 用 infinity 表 
示 正 无 穷 。 为 了 与 传统 写法 保持 一 致 ， 建 议 以 约定 俗 成 的 “前 闭 后 开 ” 方 
式 来 书写 时 间 范 围 ， 即 区 间 起 点 使 用 左 中 括号 “[”， 区 间 终 点 使 用 右 小 括号 
“)”， 比 如 [-infinity, intifinity)。 



































Ce 
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区 间 也 可 以 使 用 区 间 构 造 函 数 来 定义 ， 该 构造 函数 的 名 称 与 区 间 类 型 名 称 是 一 致 的 ， 可 以 
输入 两 个 或 者 三 个 参数 。 示 例如 下 : 


SELECT daterange('2013-01-05','infinity','[]'); 


第 三 个 参数 是 区 间 边 界 开 闭 标识 符 ， 如 果 不 填 则 默认 为 前 开 后 闭 [)。 为 清晰 起 见 ， 建 议 你 
总 是 显 式 指定 该 参数 ， 因 为 其 默认 值 不 是 那 种 非常 显而易见 的 值 ， 容 易 被 记 错 。 


5.5.4 定义 含 区 间 类 型 字段 的 表 
时 间 类 型 区 间 是 很 常用 的 ， 假 设 你 有 一 张 employment 表 ， 表 中 存储 了 公司 聘请 雇员 的 历史 
记录 。 你 可 以 像 示 例 5-25 那样 用 时 间 区 间 来 定义 一 个 员工 在 公司 的 服务 年 限 ， 而 不 需要 用 
起 始 时 间 和 结束 时 间 两 个 单独 的 字段 来 表示 。 在 示例 5-25 中 ， 我 们 给 period 列 添加 了 一 
个 索引 ， 以 使 用 我 们 的 区 间 列 加 速 查 询 。 
示例 5-25 建立 一 个 带 有 日 期 区 间 类 型 字段 的 表 

CREATE TABLE employment (id serial PRIMARY KEY, employee varchar(20), 

period daterange); 

CREATE INDEX ix_employment_period ON employment USING gist (period);© 


INSERT INTO employment (employee,period) 
VALUES 



























































('Alex','[2012-04-24, infinity)'::daterange), 
('Sonia','[2011-04-24, 2012-06-01)'::daterange), 
('Leo','[2012-06-20, 2013-04-20)'::daterange)，, 
('Regina','[2012-06-20, 2013-04-20)'::daterange); 


@ 在 区 间 字 段 上 建立 一 个 GiST 索引 。 


5.5.5 ”适用 于 区 间 类 型 的 运算 符 

区 间 类 型 上 用 得 最 多 的 两 个 运算 符 是 重 又 运算 符 (&&) 和 包含 运算 符 (@>)。 接 下 来 将 对 
这 两 个 运算 符 de 要 了 解 区 间 运 算 符 的 完整 列表 ， 请 参考 PostgreSQL 官方 手册 中 的 
“区 间 类 型 运算 符 ” 

1. 重 又 运算 符 

顾名思义 ， 重 又 判定 运算 符 8&& 的 作用 就 是 判定 两 个 区 间 是 否 有 重 受 部 分 ， 如 果 有 则 返回 
true， 否 则 返回 false。 示 例 5-26 演示 了 该 运算 符 的 用 法 ， 其 中 还 使 用 了 string_agg 国 数 
将 雇员 名 单列 表 合 并 成 一 个 文本 字段 。 

示例 5-26 查询 谁 与 谁 曾经 同时 在 公司 工作 过 


SELECT 



































el.employee, 
string_agg(DISTINCT e2.employee, ', ' ORDER BY e2.employee) As colleagues 
FROM employment As el INNER JOIN employment As e2 
ON el1.period && e2.period 
WHERE el1.employee <> e2.employee 
GROUP BY el.employee; 


employee | colleagues 





ALex | Leo, Regina, Sonia 


Leo | Alex, Regina 
Regina | Alex, Leo 
Sonia | Alex 


2. 包含 与 被 包含 关系 运算 符 

对 于 包含 关系 运算 符 @> 来 说 ， 第 一 个 参数 是 区 间 ， 第 二 个 参数 是 待 判定 的 值 。 如 果 第 二 
个 参数 的 值 落 在 第 一 个 参数 的 区 间 内 ， 运 算 符 就 返回 true， 否 则 返回 false。 示 例 5-27 演 
示 了 其 用 法 。 

示例 5-27 查询 当前 还 在 公司 工作 的 雇员 名 单 


SELECT employee FROM employment WHERE period @> CURRENT_DATE GROUP BY employee; 


























employee 

Alex 
<@ 是 用 于 判定 被 包含 关系 是 否 成 立 的 运算 符 ， 它 的 第 一 个 参数 是 待 判定 的 值 ， 第 二 个 参数 
是 区 间 ， 其 用 法 与 包含 关系 运算 符 完 全 一 致 ， 不 再 殉 述 。 


5.6 JSON 数 据 类 型 


PostgreSQL 支持 JSON 数据 类 型 并 提供 了 很 多 相关 的 函数 。JSON 已 成 为 Web 开发 领域 
最 流行 的 数据 传递 格式 。PostgreSQL 9.3 中 针对 JSON 类 型 做 了 显著 的 功能 增强 ， 新 增 了 
一 些 用 于 实现 子 树 抽取 、 内 容 编 辑 以 及 与 其 他 数据 类 型 进行 互 转 的 操作 函数 。PostgreSQL 
9.4 中 引入 了 JSONB 数据 类 型 ， 该 类 型 是 JSON 类 型 的 二 进 制版 本 ， 它 与 JSON 类 型 最 
主要 的 差别 是 JSONB 可 以 支持 索引 而 JSON 不 能 (只 能 使 用 非常 受 限制 的 函数 索引 )。 
PostgreSQL 9.5 中 为 JSONB 类 型 引入 了 更 多 的 支持 函数 ， 包 括 可 用 于 修改 jsonb 对 象 中 
的 子 元 素 的 函数 。PostgreSQL 9.6 中 引入 了 josnb_insert 函数 ， 可 以 实现 往 一 个 现 有 的 
jsonb 对 象 中 插入 数据 ， 即 支持 往 JSONB 内 部 的 数组 对 象 中 增加 新 元 素 ， 也 可 以 实现 在 
JSONB 内 部 增加 一 个 新 的 键 值 对 。 


5.6.1 插入 JSON 数 据 
要 想 在 表 中 存储 JSON 数据 ， 只 需 建 一 个 json 类 型 的 字段 即 可 ,语法 如 下 : 
CREATE TABLE persons (id serial PRIMARY KEY, person json); 


示例 5-28 的 语句 向 表 中 插入 了 一 条 JSON 记录 。PostgreSQL 会 自动 对 插入 的 JSON 文本 进 
行 格式 检查 以 确保 其 格式 合法 。 请 注意 ， 无 法 将 无 效 的 JSON 字符 串 存 储 到 某 个 JSON 列 
中 ， 而 且 也 没有 什么 办 法 可 以 把 无 效 的 JSON 字符 串 转 换 为 JSON 类 型 。 


示例 5-28 插入 一 个 JSON 字段 
INSERT INTO persons (person) 
VALUES ( 
'{ 
"name":"Sonia", 
"spouse": 
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"name":"Alex", 
"parents": 


{ 
"father":"Rafael", 
"mother":"0Ofelia" 


"type":"work", 
"number":"619-722-6719" 


"type": "cell", 
"number":"619-852-5083" 


}, 
"children": 
[ 
{ 
"name":"Brandon", 
"gender":"M" 
和 5 
{ 
"name":"Azaleah", 
"girl":true, 
"phones": [] 


5.6.2 ”查询 JSON 数 据 
要 想 对 JSON 数据 的 层次 化 结构 进行 访问 ， 最 简单 的 方法 就 是 使 用 路 径 指 向 符 。 示 例 5-29 
演示 了 一 些 常见 的 用 法 。 


示例 5-29 查询 JSON 字段 
SELECT person->'name' FROM persons ; 
SELECT person->'spouse'->'parents'->'father' FROM persons; 


也 可 以 通过 路 径 数 组 的 形式 进行 查询 ， 如 下 例 所 示 : 
SELECT person#>array['spouse','parents','father'] FROM persons; 
注意 ， 如 果 查 询 语句 中 使 用 了 路 径 数 组 ， 前 面 必须 用 # 指向 符 。 


可 以 通过 指定 下 标 来 访问 JSON 内 部 数组 的 某 个 特定 元 素 。 请 注意 ，JSON 数组 的 起 始 元 
素 下 标 与 PostgreSQL 数组 类 型 不 同 ， 前 者 从 0 开始 ， 后 者 从 1 开始 。 


SELECT person->'children'->0->'name' FROM persons ; 
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上 面 这 句 话 用 路 径 数组 语法 来 表达 就 是 : 


SELECT person#>array['children','0','name'] FROM persons; 





上 面 的 这 些 例子 中 ， 查 询 返 回 的 数据 类 型 都 是 JSON 内 部 元 素 的 基础 类 型 (数字 、 字 符 串 、 
布尔 值 )。 如 果 希 望 返回 的 值 都 统一 转换 为 文本 型 ， 那 么 只 需 在 路 径 指向 符 中 再 增加 一 个 > 
符 即 可 : 


SELECT person->'spouse'->'parents'->>'father' FROM persons; 
SELECT person#>>array['children','0','name'] FROM persons; 


可 以 看 到 ， 如 果 联 用 多 个 -> 指向 符 ， 只 需 把 最 后 一 个 指向 符 改写 为 ->> 即 可 。 


json_array_elements 函数 的 入 参 是 一 个 JSON 数组 ， 该 函数 会 将 该 JSON 数组 中 的 每 个 元 
素 拆 成 单独 一 行 输出 ， 如 示例 5-30 所 示 。 


示例 5-30 ”用 json_array_elements 国 数 展开 JSON 数组 


SELECT json_array_elements(person->'children')->>'name' As name FROM persons; 


























Brandon 
Azaleah 
(2 rows) 


JSON 类 型 本 质 上 表达 了 层次 化 结构 的 树 型 数据 ， 当 需要 访问 树 上 的 元 素 时 ， 
强烈 建议 你 使 用 指向 符 语法 。 该 语法 非常 简洁 ， 而 且 对 JSONB 类 型 也 适用 
( 稍 后 将 介绍 JSONB 类 型 )。PostgreSQL 提供 了 一 个 功能 与 指向 符 语法 对 等 
的 函数 json_extract_path， 该 函数 可 以 接受 不 定 长 人参 (也 就 是 说 该 函数 的 
入 参 个 数 可 以 无 限 多 )。 第 一 个 参数 是 待 访问 的 JSON 对 象 ， 后 续 参 数 就 是 
层次 化 访问 路 径 上 每 一 层 的 key 值 。->> 运算 符 也 有 一 个 功能 完全 对 等 的 函 
数 ， 名 为 json_extract_path_text， 其 用 法 不 再 歼 述 。 























5.6.3 输出 JSON 数 据 


PostgreSQL 除了 可 以 查询 库 中 已 有 的 JSON 数据 外 ， 还 支持 将 别 的 数据 类 型 转换 为 JSON 
类 型 。 接 下 来 的 例子 将 演示 系统 内 置 的 JSON 转换 函数 的 用 法 ， 这 类 函数 可 以 将 其 他 数据 
类 型 转换 为 JSON 类 型 。 


示例 5-31 中 将 使 用 row_to_json 函数 将 示例 5-28 中 导入 的 数据 的 部 分 字段 转换 为 JSON 数据 。 
示例 5-31 将 多 条 记录 转换 为 单个 JSON 对 象 (PostgreSQL 9.3 及 之 后 的 版 本 才 支 持 该 语句 ) 


SELECT row_to_json(f) As x 
FROM ( 


SELECT id，json_array_eLements(person->'chiLdren')->>'name' As cname FROM persons 
) As ff; 
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{"id":1,"cname":"Brandon"} 
{"id":1,"cname":"Azaleah"} 
(2 rows) 


如 果 要 将 persons 表 中 的 所 有 记录 行 整体 打包 转换 为 一 个 JSON 对 象 ， 可 以 使 用 以 下 语法 : 


SELECT row_to_json(f) As jsoned_row FROM persons As f; 


“查询 时 将 一 行 记 录 作 为 单个 字段 输出 ”这 种 功能 只 有 PostgreSQL 才 支 持 。 该 功能 对 于 创 
建 复合 JSON 对 象 特 别 有 用 。 我 们 将 在 7.2.12 市 中 深入 讨论 此 特性 ， 并 且 将 在 示例 7-20 中 
演示 如 何 使 用 array_agg 和 array_to_json 函数 将 多 条 记录 转换 为 一 个 JSON 对 象 后 输出 。 
9.3 版 新 增 了 对 json_agg 函数 的 支持 ， 示 例 7-21 中 将 演示 该 函数 的 用 法 。 


5.6.4 JSON 类 型 的 二 进 制版 本 : jsonb 


PostgreSQL 9.4 中 引入 了 新 的 jsonb 数据 类 型 。 该 类 型 使 用 的 运算 符 与 json 类 型 完全 相 
同 ; 该 类 型 的 处 理 函 数 与 json 类 型 的 处 理 函 数 一 一 对 应 ， 仅 在 命名 上 上 略 有 差别 (前 者 以 
“jsonb” 开 头 ， 后 者 以 “json” 开 头 )， 另 外 jsonb 类 型 还 比 json 类 型 多 了 一 些 新 的 函数 。 
由 于 jsonb 类 型 的 数据 在 存 入 库 中 时 经 过 了 预 解析 ， 因 此 在 处 理 过 程 中 无 须 再 次 进行 文本 
解析 ， 所 以 其 处 理性 能 远 超 json 类 型 。jsonb 数据 类 型 和 json 数据 类 型 的 关键 区 别 如 下 
所 示 。 


。 json 是 以 原始 文本 格式 存储 的 ， 而 jsonb 存储 的 是 原始 文本 解析 以 后 生成 的 二 进 制 数据 
结构 ， 该 二 进 制 结构 中 不 再 保存 原始 文本 中 的 空格 ， 存 储 下 来 的 数字 的 形式 也 发 生 了 一 
定 的 变化 ， 并 且 对 其 内 部 记录 属性 值 进行 了 排序 。 例 如 ， 文 本 中 的 e-5 这 种 数字 会 被 转 
换 为 对 应 的 小 数 存 信 
。 jsonb 不 允许 其 内 部 记录 的 键 值 重复 ， 如 果 出 现 重复 则 会 从 中 自动 选择 一 条 ， 其 余 的 
重复 记录 会 被 丢弃 ,但 json 类 型 中 记录 键 值 重复 是 允许 的 。Michael Paquier 的 博文 
“Manipulating jsonb data by abusing of key uniqueness” 中 演示 了 若干 例子 。 
。 jsonb 类 型 的 字段 上 可 以 直接 建立 GIN 索引 (该 类 索引 在 6.3 节 中 有 相关 介绍 )， 但 
json 类 型 字段 上 却 只 能 建立 函数 索引 ， 因 为 只 有 通过 函数 才能 从 JSON 的 字符 串 中 提取 
出 具体 字段 值 。 
为 了 说 明 以 上 概念 ， 我 们 另外 新 建 一 张 与 前 面 persons 结构 类 似 的 persons 表 ， 只 不 过 这 
次 用 的 是 jsonb 类 型 ; 
CREATE TABLE persons_b (id serial PRIMARY KEY, person jsonb); 
重复 执行 示例 5-28 的 步骤 ， 往 新 表 中 插入 记录 。 
目前 为 止 还 没 体现 出 JSON 和 JSONB 的 差别 ， 但 在 对 两 张 表 分 别 执行 查询 时 就 能 看 出 来 
了 。 为 了 让 JSONB 类 型 的 二 进 制 字段 值 能 够 显示 ，PostgreSQL 会 自动 将 其 转换 为 规范 化 
的 文本 表示 形式 ， 如 示例 5-32 所 示 。 
示例 5-32 JSONB 与 JSON 类 型 输出 格式 对 比 
SELECT person As b FROM persons_b WHERE id = 1; © 


SELECT person As j FROM persons WHERE id = 1; @ 
b 
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"name": "Sonia", 
"spouse": {"name": "Alex", "phones": [{"type": "work", "number": "619-722-6719"}, 
{"type": "cell", "number": "619-852-5083"}], 
"parents": {"father": "Rafael", "mother": "Ofelia"}}, 
"children": [{"name": "Brandon", "gender": "M"}, 
{"girl": true, "name": "Azaleah", "phones": []}]} 
(1 row) 


"name":"Sonia", 
"spouse": 
{ 
"name":"Alex", 
"parents": 
{ 
"father":"Rafael", 
"mother":"0felia" 


"type":"work", 
"Number":"619-722-6719"+ 


"type": "cell", 
"Nnumber":"619-852-5083"+ 


}, 


"children": 


[ 

{ 
"name": "Brandon", 
"gender":"M" 

]， 

{ 
"name":"Azaleah", 
"girl":true, 
"phones": [] 


(1 row) 
@ 可 以 看 出 ，jsonb 类 型 的 输出 是 对 输入 的 内 容 进 行 了 重新 格式 化 ， 并 删 掉 了 输入 时 文本 
中 的 空白 。 此 外 ， 插 入 记录 时 属性 字段 的 顺序 信息 是 不 保留 的 。 
@ json 类 型 的 输出 保持 了 输入 时 的 原样 ， 包 括 原文 本 中 的 空白 以 及 属性 字段 的 顺序 。 


jsonb 与 json 的 处 理 函 数 一 一 对 应 ， 但 函数 名 上 略 有 不 同 ， 而 且 jsonb 比 json 多 了 一 些 处 
理 国 数 。 例 如 ，json 适用 的 json_extract_path_text 和 json_each 国 数 对 应 于 jsonb 适用 
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的 jsonb_extract_path_text 和 jsonb_each 国 数 。 二 者 的 运算 符 完 全 相同 ， 因 此 如 果 想 把 
5.6.2 市 的 示例 改造 为 适用 jsonb 类 型 ， 只 需 把 表 名 替换 一 下 ， 然 后 把 json_array_elements 
替换 为 jsonb_array_elements 即 可 。 


jsonb 比 json 多 支持 的 运算 符 有 以 下 儿 个 等 值 判定 运算 符 (=)、 包 含 关 系 判 定 运 算 符 
(@>)、 被 包含 关系 判定 运算 符 〈<@) 、 键 值 存在 判定 运算 符 〈?)、 判 定 一 组 键 值 中 是 否 有 任 
意 一 个 已 存在 的 运算 符 〈?1) ， 以 及 判定 一 组 键 值 中 的 每 一 个 是 否 均 已 存在 的 运算 符 〈?8&) 。 
假设 要 列 出 所 有 孩子 姓 名 为 “Brandon” 的 人 员 名 单 ， 就 可 以 使 用 包含 关系 判定 运算 符 ， 
如 示例 5-33 所 示 。 
示例 5-33 JSONB 包含 关系 运算 符 的 使 用 

SELECT person->>'name' As name 


FROM persons_b 
WHERE person @> '{"children":[{"name":"Brandon"}]}'; 











如 果 在 jsonb 列 上 创建 了 GIN 索引 ， 那 么 前 述 这 几 个 运算 符 的 操作 速度 是 极 快 的 : 


CREATE INDEX ix_persons_jb_person_gin ON persons_b USING gin (person); 


我 们 演示 用 的 这 些 表 都 很 小 ， 因 此 规划 器 可 能 会 选择 走 全 表 扫 描 而 不 是 走 索 引 查询 ， 但 如 
果 有 更 多 的 记录 ， 示 例 5-33 中 这 种 语句 是 一 定 会 用 上 索引 的 。 


5.6.5 ”编辑 JSONB 类 型 的 数据 

PostgreSQL 9.5 中 为 了 支持 对 JSONB 类 型 的 数据 进行 修改 ， 引 入 了 原生 的 jsonb 连接 运 
算 符 (11) 以 及 删 减 运 算 符 (-、#-)， 同 时 还 引入 了 一 些 辅助 操作 函数 。 注 意 ，json 类 型 
并 不 支持 这 些 运算 符 。 如 果 要 在 PostgreSQL 9.5 之 前 的 版 本 中 实现 相同 的 功能 ， 必 须 通 过 
JavaScript 扩展 语言 来 实现 ， 可 参考 8.5 市 的 内 容 。 


连接 运算 符 可 用 于 对 一 个 jsonb 对 象 新 增 或 者 替换 其 内 部 属性 字段 。 在 示例 5-34 中 ， 我 们 为 
Gomez 家 对 应 的 jsonb 对 象 新 增 了 一 个 地 址 属性 ， 并 使 用 RETURNING 语法 返回 了 更 新 后 字段 
的 值 。 关 于 RETURNING 语法 ， 请 参考 7.2.10 节 的 内 容 。 返 回 的 新 值 中 会 含有 地 址 属性 字段 。 


示例 5-34 使 用 JSONB 的 || 运算 符 来 增加 地 址 
UPDATE persons_b 
SET person = person || '{"address": "Somewhere in San Diego, CA"}'::jsonb 
WHERE person @> '{"name":"Sonia"}' 
RETURNING person; 
profile 


















































{"name": "Sonia", ... "address": "Somewhere in San Diego, CA", "children": ...} 
(1 row) 
UPDATE 1 


由 于 JSONB 类 型 要 求 内 部 属性 字段 的 键 值 必须 唯一 ， 因 此 如 果 你 试图 插入 一 个 重复 名 称 
的 属性 字段 ， 原 来 的 同名 属性 字段 值 会 被 替换 掉 。 因 此 如 需 修改 旧地 址 ， 可 以 使 用 与 示 





























108 | 第 5 章 


例 5-34 中 完全 相同 的 语句 ， 只 需 把 其 中 的 “Somewhere in San Diego, CA” 替 换 为 新 的 
地 址 即 可 。 


如 果 需 要 把 地 址 属性 删 掉 ， 可 以 使 用 - 运算 符 ， 如 示例 5-35 所 示 。 
示例 5-35 ”使 用 JSONB 的 - 运算 符 来 移 除 某 个 属性 


UPDATE persons_b 
SET person = person - 'address' 
WHERE person @> '{"name":"Sonia"}'; 


请 注意 ， 简 单 地 使 用 - 运算 符 只 能 删 掉 JSONB 层次 化 树 结构 上 第 一 层 的 元 素 。 如 果 需 要 删 
除 内 部 某 一 层 的 特定 属性 怎么 办 呢 ? 此 时 可 以 使 用 # 运算 符 。 该 运算 符 使 用 一 个 表达 了 待 删 
除 属性 所 在 路 径 的 文本 值 数 组 作为 人参 。 在 示例 5-36 中 ， 我 们 删除 了 Azaleah 的 girl 属性 。 


示例 5-36 使 用 JSONB 的 #- 运算 符 删 除 内 租 的 某 个 元 素 
UPDATE persons_b 
SET person = person #- '{children,1,girl}'::text[] 
WHERE person @> '{"name":"Sonia"}' 
RETURNING person->'children'->1; 

















{"name": "Azaleah", "phones": []} 


如 需 删 除 JSONB 内 部 数组 的 某 个 特定 元 素 ， 请 指明 其 下 标 。 由 于 JavaSeript 语言 中 数组 元 
素 的 下 标 从 0 开始 计数 ， 所 以 如 果 要 删除 第 二 个 子 节 点 的 某 个 元 素 ， 下 标 需 写成 1 而 不 是 
2。 如 果 需 删除 整个 名 为 “Azalean” 的 子 节 点 ， 可 以 写成 '{children,1}'::text[]。 


如 需 插 入 一 个 gender 属性 或 者 是 修改 gender 属性 值 ， 可 以 使 用 jsonb_set 函数 ， 如 示例 
5-37 所 示 。 
示例 5-37 使 用 jsonb_set 函数 修改 内 部 般 套 的 属性 值 

UPDATE persons_b 


SET person = jsonb_set(person,'{children,1,gender}'::text[],'"F"'::jsonb, true) 
WHERE person @> '{"name":"Sonia"}'; 


jsonb_set 函数 有 四 个 人参 ， 其 定义 的 形式 为 : jsonb_set(jsonb_to_update， text_array_ 
path，new_jsonb_value，allow_creation)。 如 果 将 allow_creation 置 为 false， 当 所 需 修 
改 的 属性 值 不 存在 时 ， 该 函数 会 返回 错误 。 


5.7 XML 数 据 类 型 


XML 和 JSON 这 两 种 数据 类 型 都 属于 非 规范 化 数据 ， 在 关系 型 数据 库 中 存储 这 类 数据 其 实 
是 有 争议 的 。 然 而 ， 所 有 的 高 级 关系 型 数据 库 (比如 IJBM DB2、Oracle、SQL Server) 中 
都 支持 XML 数据 类 型 。 作 为 最 先进 的 开源 关系 型 数据 库 ，PostgreSQL 自然 也 会 支持 XML 
数据 类 型 ， 并 且 还 提供 了 大 量 XML 操作 函数 。 我 们 发 表 过 很 多 关于 在 PostgreSQL 中 使 用 
XML 数据 类 型 的 技术 文章 。PostgreSQL 原生 支持 创建 、 管 理 和 解析 XML 数据 的 函数 ， 详 
细 列 表 可 参见 PostgreSQL 官方 手册 中 “XML 函数 ”一 市 。 与 jsonb 数据 类 型 不 一 样 ， 目 
前 没有 哪 种 索引 类 型 支持 直接 对 XML 数据 类 型 进行 索引 ， 因 此 只 能 使 用 函数 索引 对 其 一 
部 分 数据 进行 索引 ， 这 一 点 与 json 是 相同 的 。 
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5.7.1 插入 XML 数据 


在 往 一 个 xml 数据 类 型 的 列 中 插入 数据 时 ，PostgreSQL 会 自动 判定 并 确保 只 有 格式 合法 的 
XML 才 会 创建 成 功 。text 类 型 字段 中 也 可 以 存 入 一段 XML 文本 ， 但 是 存 和 时 不 会 进行 格 
式 合 法 性 判断 ， 这 一 点 是 text 与 xml 类 型 的 区 别 。 不 过 请 注意 ， 即 使 XML 文本 的 内 容 中 
附带 了 DTD 或 者 XSD 的 格式 描述 ，PostgreSQL 也 不 会 按照 这 些 格式 要 求 来 对 XML 的 格 
式 进行 验证 。 为 了 梳理 一 下 构成 有 效 XML 的 要 素 ， 示 例 5-38 展示 了 通过 将 某 个 列 声明 为 
xml 并 照常 将 数据 插入 到 该 列 中 ， 如 何 将 XML 数据 追加 到 表 中 。 


示例 5-38 插入 XML 字段 记录 
CREATE TABLE families (id serial PRIMARYKEY, profile xml); 
INSERT INTO families(profile) 
VALUES( 

'<family name="Gomez"> 
<member><relation>padre</relation><name>Alex</name></member> 
<member><relation>madre</relation><name>Sonia</name></member> 
<member><relation>hijo</relation><name>Brandon</name></member> 
<member><relation>hija</relation><name>Azaleah</name></member> 
</family>'); 

XML 数据 的 格式 是 千变万化 的 ， 你 可 以 为 XML 字段 设置 一 个 check 约束 以 确保 输入 的 
XML 数据 都 符合 某 种 格式 (如 需 了 解 check 约束 的 详细 信息 ， 请 参考 6.2.3 节 的 内 容 )。 示 
例 5-39 中 创建 了 一 个 check 约束 ， 该 约束 要 求 输入 的 XML 数据 中 的 famity 节点 下 都 有 一 
个 relation 节点 。'/family/member/relation' 是 XPath 语法 ， XPath 是 一 种 能 够 在 XML 
树 状 结构 中 定位 到 指定 元 素 的 语法 。 
示例 5-39 ”确保 所 有 XML 字段 记录 中 都 有 至 少 一 个 member 节点 和 一 个 relation 市 点 
ALTER TABLE families ADD CONSTRAINT chk_has_relation 
CHECK (xpath_exists('/family/member/relation', profile)); 
如 果 试 图 插入 这 样 一 条 记录 : 
INSERT INTO families (profile) VALUES ('<family name="HsuObe"></family>'); 
我 们 会 看 到 这 样 的 报错 信息 : ERROR: new row for relation "families" violates check 
constraint "chk_has_reLation" (错误 : 试图 插入 “families” 表 中 的 新 记录 违反 了 约束 
“chk_has_relation” 的 要 求 )。 


如 果 需 要 基于 DTD 或 者 XSD 对 XML 数据 进行 格式 检查 ， 你 需要 自行 编写 格式 检查 函 
数 ， 然 后 将 此 函数 放 到 check 约束 中 调用 。PostgreSQL 目前 还 没有 原生 支持 基于 DTD 或 
者 XSD 的 格式 检查 。 


5.7.2 ”查询 XML 数据 


查询 XML 数据 时 ，xpath 函数 会 发 挥 重要 作用 。 该 函数 的 第 一 个 参数 是 一 个 XPath 查询 
表达 式 ， 第 二 个 参数 是 一 个 xml 对 象 。 查 询 结果 是 XPath 查询 语句 所 要 查找 的 XML 元 素 
的 列表 。 示 例 5-40 中 查询 出 了 所 有 的 家 庭 成 员 ， 查 询 中 同时 使 用 了 xpath 和 unnest 函数 ， 
其 中 unnest 函数 用 于 将 数组 转换 成 结果 集 。 这 样 我 们 就 把 一 段 XML 中 的 零碎 信息 提取 出 
来 并 转换 成 了 文本 。 
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示例 5-40 查询 XML 字段 
SELECT ordinality AS id, family, 
(xpath('/member/relation/text()', f))[1]::text As relation, 
(xpath('/member/name/text()', f))[1]::text As mem name © 


FROM ( 
SELECT 
(xpath('/family/@name', profile))[1]::text As fanily, @ 
f.ordinality, f.f 
FROM families, unnest(xpath('/family/member', profile)) WITH ORDINALITY AS f 
) x;@ 
id | family | relation | mem_name 
----+-------- +---------- +---------- 
1 | Gomez | padre | ALex 
2 | Gomez | madre | Sonia 
3 | Gomez | hijo | Brandon 
4 | Gomez | hija | Azaleah 
(4 rows) 


@ 获取 每 个 member 元 素 的 relation 标签 和 name 标签 中 包含 的 文本 元 素 。 此 处 的 语法 中 必 
须 加 数组 下 标 ， 因 为 xpath 语法 返回 的 查询 结果 是 数组 类 型 的 ， 即 使 返回 的 数组 中 只 
一 个 元 素 也 得 加 下 标 才 能 访问 。 

@ 获取 family 根 节 点 的 name 属性 值 。 访 问 属性 值 的 语法 为 @attribute_name。 

@ 将 SELECT 语句 的 查询 结果 拆 分 为 多 个 子 元素 ， 这 些 子 元 素 包 括 <mnember>、<relation>、 
</relation>、<name>、</name> 和 </member>。xpath 的 斜 杠 语 法 表示 要 获取 当前 指 
定 节 点 的 子 节点 的 内 容 。 例 如 ，xpath('/famitLy/member' ， "profite') 将 以 数组 形式 返 

profile 字段 中 famitLy 节点 下 所 有 member 子 节 点 的 内 容 。xpath('/family/@name'， 

'profile') 返回 的 是 famity 节点 的 name 属性 的 值 。 默 认 情 况 下 ，xpath 返回 的 是 包含 前 

后 标签 部 分 的 完整 节点 内 容 ， 加 了 text() 以 后 ， 返 回 的 就 是 该 节点 中 包含 的 文本 的 内 容 。 


PostgreSQL 10 中 新 增 支持 了 ANSI-SQL 中 的 XMLTABLE 语法 。XMLTABLE 可 以 基于 预定 义 好 的 
转换 规则 ， 将 一 段 XML 文本 映射 为 独立 的 行 和 列 。 接 下 来 使 用 XMLTABLE 语法 把 示例 5-40 
再 实现 一 遍 。 


示例 5-41 使 用 XMLTABLE 语法 来 查询 XML 数据 
SELECT xt.* 
FROM families, 
XMLTABLE ('/family/member' PASSING profile © 
COLUMNS @ 

id FOR ORDINALITY , © 
family text PATH '../@nane' , @ 
relation text NOT NULL , © 
member_name text PATH 'name' NOT NULL 





























加 | 

















) AS xt; 

id | family | relation | mem_name 
----+-------- +---------- +---------- 

1 | Gomez | padre | ALex 

2 | Gomez | madre | Sonia 

3 | Gomez | hijo | Brandon 

4 | Gomez | hija | Azaleah 
(4 rows) 
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@ XMLTABLE 定义 中 的 第 一 部 分 是 一 个 XML 路 径 ， 表 明 从 XML 对 象 的 哪个 具体 位 置 抽取 
数据 行 。PASSING 关键 字 后 跟 字 段 名 ， 表 示 从 哪个 字段 中 抽取 行 数 据 ， 该 字段 一 定 要 是 
xml 类 型 。 此 处 我 们 使 用 families 表 的 profile 字段 。 

@ COLUMNS 关键 字 表示 下 面 即将 定义 从 XML 数据 中 抽取 出 来 的 字段 列表 。 

@ 此 前 介绍 过 ， 在 支持 返回 结果 集 的 函数 中 可 以 使 用 WITH ORDINALITY 语法 来 标记 所 返回 
记录 的 行 号 ， 此 处 可 以 类 似 地 使 用 FOR ORDINALITY 语法 来 标记 查询 结果 的 行 号 。 

@ 你 可 以 使 用 ../ 表达 式 定 位 到 当前 行 位 置 的 上 一 层 。 此 处 我 们 使 用 ../ename 来 获取 
famity 节点 的 name 属性 ， 该 属性 所 在 的 层级 比 family/member 节点 要 高 一 级 。Q 符号 表示 
要 取 的 是 一 个 属性 值 (XML 中 属性 值 的 语法 形式 为 name='a vatLue' ) 而 不 是 一 个 元 素 。 

@ 如 果 原 始 XML 中 待 取 数据 的 路 径 上 的 元 素 名 与 预定 义 的 转换 规则 中 指定 的 字段 名 相 
同 ， 则 无 须 在 规则 定义 中 为 目标 字段 设 定 PATH 值 〈 即 该 字段 的 数据 来 源 路 径 )。 本 例 
中 ， 由 于 原始 XML 中 /family/member/ralation 这 个 路 径 上 的 relation 元 素 名 与 转换 
规则 中 定义 的 relation 字段 同名 ， 所 以 无 须 在 这 里 写 PATH 来 指定 数据 来 源 路 径 。 


5.8 全文 检索 


我 相信 你 一 定 曾 经 在 某 些 网 站 上 体验 过 关键 词 搜索 功能 。 如 果 是 电 商 类 网 站 ， 那 么 可 以 搜 
索 出 匹配 关键 词 的 商品 列表 ， 如 果 是 电影 类 网 站 ， 那 么 可 以 搜索 出 符合 关键 词 过 让 条 件 的 
影 ， 如 果 是 知识 问答 类 网 站 ， 那 么 可 以 搜索 出 匹配 关键 词 的 问题 和 答案 。 


要 想 实现 通过 关键 词 对 文本 内 容 进行 搜索 ， 可 以 使 用 常见 的 Like 或 者 ilike (忽略 大 小 
写 的 like) 这 样 的 匹配 方法 ， 也 可 以 使 用 强大 的 正则 表达 式 或 者 soundex 语音 匹配 算法 。 
但 这 些 方法 都 存在 一 个 问题 ， 它 们 无 法 实现 基于 自然 语言 的 匹配 。 例 如 ， 如 果 你 想 搜索 
LGBT 类 的 电影 ， 把 “LGBT” 作 为 搜索 关键 词 ， 那 么 那些 电影 介绍 中 带 有 “lesbian、gay、 
bisexual、transgendered” 的 电影 就 搜 不 出 来 ， 因 为 文本 不 匹配 。 


FTS (full text search， 全 文 检索 ) 是 一 个 带 有 一 定 “ 智 能 ”的 搜索 工具 包 。 虽 然 它 离 能 够 
理解 人 类 的 真实 想法 还 差 得 远 ， 但 是 它 能 够 在 搜索 过 程 中 找到 意义 相近 的 词 ， 而 不 仅仅 是 
拼写 相近 的 词 。FTS 是 PostgreSQL 原生 自 带 的 一 个 功能 模块 ， 不 需要 单独 安装 。 


FTS 的 核心 是 一 个 被 称 为 “FTS 配置 库 ” 的 东西 。 这 个 库 记 录 了 词 与 词 之 间 的 语义 匹配 规 
则 ， 其 依据 是 一 本 或 者 多 本 词典 。 例 如 ， 如 果 你 的 词典 将 love、romance、infatuation、lust 
这 几 个 词 当 成 同义词 ， 那 么 把 其 中 的 一 个 作为 关键 词 进行 搜索 时 ， 带 有 其 他 几 个 词 的 文本 
会 被 认为 是 符合 搜索 条 件 的 。 词 典 也 会 把 主干 相同 的 词 当成 同义词 ， 例 如 love、loving、 
loved 就 是 主干 相同 的 词 。 词 典 还 会 将 同一 个 动词 的 不 同时 态 下 的 分 词 作为 同义词 处 理 ， 
比如 eat、eats、ate、eaten 就 会 被 认为 是 同义词 。 
词典 中 还 可 以 包含 停止 词 ， 它 是 指 一 段 话 中 意义 不 大 的 那 部 分 内 容 。 冠 词 、 连 接 词 、 介 
词 、 代 词 都 是 停止 词 ， 比 如 a、the、on、that 等 。 


如 上 所 述 ，FTS 能 够 实现 同义词 搜索 以 及 对 无 意义 停止 词 的 过 汪 ， 此 外 它 还 能 够 设置 搜索 
结果 的 排名 规则 。FTS 可 以 根据 词 与 词 之 间 的 邻近 程度 以 及 关键 词 出 现 的 频 度 来 为 搜索 结 
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注 2: 英文 中 “ 女 同 性 恋 、 男 同性 恋 、 双 性 人 、 变 性 人 ” 合 在 一 起 的 简称 。 一 一 译 者 注 
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果 排 名 。 例 如 ， 如 果 你 对 描写 romance 和 campus 的 电影 感 兴趣 ， 可 以 同时 搜索 romance 
加 campus， 另 外 还 可 以 指定 这 两 个 关键 词 必 须 作 为 两 个 单独 的 词 存在 ， 而 且 可 以 指定 对 
于 同时 包含 这 两 个 关键 词 的 搜索 结果 的 排名 应 更 靠 前 。FTS 还 支持 为 同一 关键 词 出 现 的 位 
置 不 同 而 给 予 不 同 的 权重 评分 。 例 如 ， 如 果 电 影 的 标题 、 副 标题 或 者 剧情 介绍 中 都 可 能 出 
现 romance 字样 ， 你 可 以 让 标题 或 者 副标题 中 出 现 romance 字样 的 电影 的 搜索 结果 排名 更 
靠 前 。 


5.8.1 FTS 配 置 库 

大 多 数 PostgreSQL 发 行 版 中 都 自 带 了 10 个 以 上 的 FTS 配置 库 ， 这 些 配 置 库 都 安装 在 
pg_catalog Schema 中 。 

可 以 通过 SELECT cfgname FROM pg_ts_config; 语句 或 者 是 psql 的 \dF 命令 来 查 出 所 有 已 安 
装 的 配置 库 。 一 般 情 况 下 查询 结果 如 下 : 


cfgname 










































































simple 
danish 
dutch 
english 
finnish 
french 
german 
hungarian 
italian 
norwegian 
portuguese 
romanian 
russian 
spanish 
swedish 
turkish 
(16 rows) 


用 户 如 需 创建 自 定义 的 配置 库 或 者 词典 ， 可 以 参考 PostgreSQL 官方 手册 中 “全 文 搜索 配置 
库 ” 和 “全 文 搜索 词典 ”这 两 部 分 的 内 容 。 

PostgreSQL 并 不 要 求 用 户 使 用 系统 自 带 的 FTS 配置 库 ， 而 是 允许 用 户 创 建 自 定义 的 FTS 
配置 库 。 但 在 真正 开始 创建 自 定义 配置 库 之 前 ， 建 议 你 查看 一 下 是 否 已 经 有 别 的 用 户 创建 了 
能 够 满足 你 要 求 的 配置 库 ， 这 样 你 就 不 用 自己 重 弄 一 遍 了 。 如 果 你 要 做 检索 的 目标 文本 属于 
医学 领域 ， 你 可 能 会 发 现 已 经 有 人 创建 好 了 这 样 的 FTS 词典 ， 其 中 记录 了 大 量 的 医学 术语 ， 
如 果 你 要 检索 西班牙 文 的 文本 ， 也 可 以 找到 为 你 所 要 的 西班牙 方言 量 身 定做 的 配置 库 。 

一 旦 确定 了 要 添加 的 目标 配置 库 ， 安 装 非常 简单 ， 一 般 也 不 需要 进行 编译 。 我 们 以 著名 的 
hunspell 配置 库 为 例 来 演示 安装 过 程 。 
请 先 从 hunspell_dicts 下 载 hunspell 配置 库 。 该 库 支 持 多 种 语言 ， 我 们 选择 安装 其 中 的 


hunspell_en_us。 




































































数据 类 型 | 113 


(GD) 下 载 对 应 目录 中 的 所 有 文件 。 
(2) 将 下 载 的 en_us.affix 和 en_us.dict 这 两 个 文件 复制 到 PostgreSQL 安装 目录 下 的 share/ 





tsearch_data 子 目 录 中 。 


(3) 将 hunspell_en_us--*.sql 和 hunspell_en_us.control 文件 复制 到 PostgreSQL 安装 目录 下 的 
share/extension 子 目录 中 。 


然后 执行 以 下 命令 : 


CREATE EXTENSION hunspell_en _us SCHEMA pg_catalog; 
然后 在 psql 中 执行 示例 5-42， 就 可 以 看 到 刚刚 安装 的 hunspell 配置 库 和 词典 的 细节 。 


示例 5-42 FTS 的 hunspell 配置 库 
\dF+ english_hunspell; 





Text search configuration "pg_catalog.english _ hunspell" 
Parser: "pg_catalog.default" 


Token 
asciihword 
asciiword 
email 

file 

float 

host 

hword 
hword_asciipart 
hword_numpart 
hword_part 
int 

numhword 
numword 
sfloat 

uint 

url 

url_path 
version 

word 





证 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 


请 注意 ， 不 是 所 有 FTS 配置 库 的 安装 方法 都 完全 相同 ， 请 按照 各 自 的 安装 手 


Dictionaries 
engLish_hunspeLL,engLish_stem 
engLish_hunspeLL,engLish_stem 
simple 

simple 

simple 

simple 
engLish_hunspeLL,engLish_stem 
engLish_hunspeLL,engLish_stem 
simple 
english_hunspell,english_stem 
simple 

simple 

simple 

simple 

simple 

simple 

simple 

simple 
english_hunspell,english_stem 








示例 5-43 中 的 命令 用 来 查看 PostgreSQL 自 带 的 English 配置 库 的 详情 ， 输 出 结果 中 会 展示 
使 用 了 哪些 词典 。 可 以 将 这 里 的 输出 内 容 与 前 面 hunspell 配置 库 的 输出 内 容 做 个 对 比 。 


示例 5-43 FTS 的 English 配置 库 


\dF+ english; 

















Text search configuration "pg_catalog.english" 
Parser: "pg_catalog.default" 





大 
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Dictionaries 


asciihword english_stem 
asciiword english_stem 
email simple 
file simple 
float simple 
host simple 


| 
| 
| 
| 
| 
| 
| 
hword | english_stem 
hword_asciipart | engLish_stem 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 


hword_numpart simple 
hword_part english_stem 
int simple 
numhword simple 
numword simple 
sfloat simple 
uint simple 
url simple 
url_path simple 
version simple 
word english_stem 


可 以 看 到 ， 二 者 唯一 的 区 别 就 是 hunspell 配置 库 额 外 依赖 了 一 个 名 为 english_hunspell 的 
词典 。 


如 果 想 了 解 哪个 配置 库 是 系统 当前 默认 使 用 的 库 ， 可 以 这 样 查询 : 


SHOW default_text_search_config; 


如 果 希 望 修 改 默 认 配 置 ， 可 以 使 用 这 个 命令 : 


ALTER DATABASE postgresqL_book 
SET defauLt_text_search_config = 'pg_catalog.english'; 


替换 后 该 参数 是 在 database 级 别 生效 的 ， 但 它 也 可 以 在 服务 器 级 、 用 户 级 或 者 会 话 级 生 
效 ， 这 一 点 和 其 他 配置 参数 没什么 不 同 。 


5.8.2 TSVector 原 始 文 本 向 量 


原始 文本 必须 先 被 向 量化 然后 才能 通过 FTS 对 其 进行 全 文 检索 ， 向 量化 以 后 的 内 容 需 存储 
在 一 个 单独 的 向 量 字 段 中 ， 访 向量 字段 使 用 的 数据 类 型 是 tsvector。 要 从 原始 文本 中 生成 
tsvector 向 量 字 段 ， 需 要 先 指定 使 用 哪个 FTS 配置 库 。 原 始 文本 经 过 向 量化 处 理 以 后 会 变 
成 一 个 很 精简 的 单词 库 ， 这 个 库 中 的 每 个 词 都 被 称 为 “词素 ”(lexeme， 即 不 能 再 拆 解 的 
单词 或 词组 ， 如 果 拆 解 将 失去 原来 的 含义 )， 同 时 这 个 库 已 经 剔除 了 前 面 介 绍 过 的 停止 词 。 
tsvector 字段 中 记录 了 每 个 词素 在 原始 文本 中 出 现 的 位 置 。 一 个 词 出 现 的 次 数 越 多 ， 其 权 
重 值 也 就 越 大 。 这 样 每 个 词素 都 会 对 应 至 少 一 个 位 置信 息 ， 如 果 出 现 多 次 则 对 应 多 个 位 置 
信息 ， 看 起 来 就 像 是 一 个 可 变 长 或 变 短 的 向 量 ， 这 也 是 tsvector 这 个 名 字 的 由 来 。 


可 以 使 用 to_tsvector 国 数 来 对 一 个 大 文本 对 象 进 行 向 量化 。 默 认 情 况 下 ， 该 函数 会 使 用 
系统 默认 的 FTS 配置 库 ， 当 然 你 也 可 以 显 式 指定 使 用 另 一 个 FTS 配置 库 。 
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示例 5-44 演示 了 基于 不 同 的 FTS 配置 库 将 同一 段 文本 向 量化 以 后 得 到 的 结果 有 何 差异 。 
示例 5-44 ”基于 不 同 的 FTS 配置 库 对 文本 进行 向 量化 操作 





SELECT 
c.name ， 
CASE 
WHEN c.name ='default' THEN to_tsvector(f.t) 
ELSE to_tsvector(c.name::regconfig,f.t) 
END As vect 
FROM ( 


SELECT 'Just dancing ;in the rain. I Like to dance.'::text) As f(t), ( 
VALUES ('default'),('english'),('english_hunspell'),('simple') 
) As c(name); 


name | vect 

ed Fa 汪 有 和 区 生生 全 守 人 志 
default | 'danc':2,9 'like':7 'rain':5 

english | 'danc':2,9 'like':7 'rain':5 

engLish_hunspeLL | 'dance':2,9 'dancing':2 'like':7 'rain':5 

simple | 'dance':9 'dancing':2 'i':6 'in':3 'just':1 'like':7 

'rain':5 'the':4 'to':8 

(4 rows) 


从 示例 5-44 中 可 以 看 出 基于 四 个 不 同 的 FTS 配置 库 得 到 的 文本 向 量化 结果 有 何不 同 。 请 
注意 其 中 的 English 和 Hunspell 配置 库 剔 除了 所 有 像 just 和 to 这 样 的 停止 词 ， 此 外 还 按照 
词典 中 记录 的 信息 对 部 分 单词 进行 了 规范 化 处 理 ， 比 如 dancing 变 成 了 danc 或 者 dance。 

Simple 配置 库 不 识别 词 干 和 停止 词 ， 因 此 其 向 量化 结果 中 就 会 出 现 同一 个 词 的 多 种 时 态 和 
那些 停止 词 。 


可 以 看 到 ，to_vector 函数 的 输出 结果 中 还 包含 每 个 词素 在 原始 文本 中 出 现 的 位 置 。 比 如 ， 
'danc' :2,9 就 表示 dancing 和 dance 这 两 个 词 分 别 出 现在 原始 文本 中 的 第 二 个 词 和 第 九 个 
词 的 位 置 。 


要 想 在 你 的 database 中 支持 FTS 能 力 ， 需 要 在 存储 原始 文本 的 表 上 增加 一 个 tsvector 类 
型 的 向 量 字 段 ， 然 后 通过 定时 任务 定期 更 新 该 向 量 字段 或 者 在 表 上 创建 个 触发 器 ， 一 旦 原 
台 文本 字段 发 生 了 修改 ， 则 同时 更 新 向 量 字段 。 


我 们 通过 一 些 虚构 的 电影 数据 来 进行 演示 。 用 psql 工具 可 以 执行 其 中 的 包 m.sql 脚本 ， 语 
法 如 下 : 


\encoding utf8; 
\i film.sql 


然后 我 们 为 filn 表 添 加 一 个 tsvector 向 量 字 段 ， 并 生成 其 内 容 ， 如 示例 5-45 所 示 。 


示例 5-45 ”增加 tsvector 向 量 字 段 并 设置 词素 权重 
ALTER TABLE film ADD COLUMN fts tsvector; 
UPDATE film 
SET fts = 
setweight(to_tsvector(COALESCE(title,'')),'A') || 
setweight(to_tsvector(COALESCE(description,'')),'B'); 
CREATE INDEX ix_film fts_gin ON film USING gin (fts); 


示例 5-45 中 ， 我 们 对 title 和 description 字段 进行 了 向 量化 并 把 结果 存 入 了 新 增 的 向 量 


























































































































为 了 使 查询 更 快 ， 我 们 还 在 向 量 字 段 上 创建 了 一 个 GIN 类 型 的 索引 。GIN 是 无 损 索 

， 你 也 可 以 对 其 创建 一 个 GiST 类 型 的 有 损 索引 。 相 比 GIN 索引 ，GiST 索引 的 特点 是 原 
0 可 能 会 丢失 并 且 访 问 速 度 会 慢 一 些 ,但 它 的 构造 速度 很 快 而 且 占 用 磁盘 空间 也 
更 小 。 相 关内 容 在 6.3 节 中 有 更 详细 的 介绍 。 


可 以 看 到 ， 我 们 在 为 fts 字段 生成 数据 的 过 程 中 还 使 用 了 另外 两 个 前 面 没 介绍 过 的 语法 : 
setweight 函数 和 连接 运算 符 ||。 


为 了 区 分 不 同 词素 的 重要 程度 ， 我 们 引入 了 权重 (weight) 的 概念 ， 每 个 词素 都 有 自己 的 
权重 。 权 重 值 只 能 是 A、B、C 和 DD 四 类 中 的 一 种 ，A 类 表示 重要 程度 最 高 ， 在 搜索 结果 
中 也 需要 排名 最 靠 前 。 在 示例 5-45 中 ， 我 们 为 从 原始 文本 的 title 字段 中 抽取 出 来 的 词素 
赋予 了 A 类 权重 ， 然 后 为 description 字段 中 的 词素 赋予 了 B 类 权重 。 如 果 我 们 搜索 的 关 
键 词 命中 了 title 中 的 某 个 词素 ， 那 么 我 们 认为 这 个 搜索 结果 比 从 description 字段 抽取 
出 来 的 词素 命中 的 结果 相关 性 更 高 ， 更 符合 用 户 的 需要 。 


多 个 tsvector 向 量 可 以 通过 连接 运算 符 || 合并 为 一 个 新 的 tsvector。 我 们 在 前 面 的 例子 
中 使 用 了 该 运算 符 将 title 和 descriptton 中 生成 的 向 量 合并 为 一 个 ， 这 样 真正 执行 全 文 
检索 时 ， 只 需要 搜索 一 个 向 量 字段 即 可 。 


如 果 原 始 文本 字段 的 内 容 发 生 了 改变 ， 那 么 必须 对 其 重新 进行 向 量化 。 为 了 避免 每 次 都 要 
手动 执行 to_tsvector 来 重新 向 量化 ， 可 以 针对 更 新 操作 建立 一 个 触发 器 。 这 个 触发 器 可 
以 基于 下 面 这 个 非常 好 用 的 触发 器 国 数 来 构造 ， 如 示例 5-46 所 示 。 
示例 5-46 ”能够 自动 更 新 问 量 字段 的 触发 器 

CREATE TRIGGER trig_ tsv_film iu 

BEFORE INSERT OR UPDATE OF title, description ON film FOR EACH ROW 


EXECUTE PROCEDURE tsvector_update_ trigger(fts,'pg_catalog.english', 
title,description); 


一 旦 在 title 或 description 字段 上 执行 了 insert 或 者 update 操作 ， 则 该 触发 器 会 被 触 
发 ， 然 后 会 自动 完成 重新 问 量 化 的 工作 。 这 个 方法 有 个 缺点 ， 就 是 里 面 调用 的 tsvector_ 
update_trigger 国 数 不 支 持 设置 权重 。 


5.8.3 TSQueries 检 索 条 件 向 量 


对 于 FTS 或 者 任何 别 的 文本 检索 方法 来 说 ， 都 必须 具备 两 个 基本 元 素 : 一 个 是 被 检索 的 原 
始 文本 ， 一 个 是 检索 条 件 (或 者 说 关键 词 )。 对 FTS 来 说 ， 原 始 文 本 和 检索 条 件 都 必须 先 
被 向 量化 然后 才能 使 用 。 前 面 已 经 介绍 过 了 如 何 针对 原始 文本 创建 tsvector 向 量 字段 ， 接 
下 来 将 介绍 如 何 对 检索 条 件 进行 向 量化 处 理 。 


在 FTS 检索 机 制 中 ， 用 tsquery 类 型 来 表示 向 量化 以 后 的 检索 条 件 。PostgreSQL 提供 了 
若干 函数 来 实现 检索 条 件 的 向 量化 处 理 ， 包 括 to_tsquery、plainto_tsquery 和 phraseto_ 
tsquery。 其 中 phraseto_tsquery 是 PostgreSQL 9.6 新 引入 的 ， 相 比 其 他 两 个 ， 该 函数 会 将 
检索 条 件 中 各 关键 词 的 顺序 也 考虑 在 内 。 


检索 条 件 向 量 一 般 是 运行 时 临时 生成 的 ， 不 会 放 到 表 中 存储 下 来 。 然 而 ， 如 果 你 的 系 
支持 用 户 把 自 定义 的 检索 条 件 存储 下 来 供 下 次 重用 ， 那 么 你 te 
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tsquery 类 型 的 字段 存 下 来 。 
示例 5-47 演示 了 to_tsquery 国 数 的 输出 结果 ， 分 别 基 于 两 个 配置 库 : 默认 的 English 库 和 
我 们 后 加 的 Hunspell 库 。 


示例 5-47 用 to_tsquery 函数 来 构造 tsquery 问 量 
SELECT to_tsquery('business & analytics'); 























to_tsquery 


'busi' & "anatLyt' 
SELECT to_tsquery('english_hunspell','business & analytics'); 


to_tsquery 


('business' | 'busy') & 'anatLyt' 


这 两 个 例子 都 是 用 business 和 analytics 两 个 词 来 进行 全 文 检索 ， 其 中 的 与 运算 符 (&) 表 
示 两 个 关键 词 必须 在 目标 文本 中 同时 出 现 才 算 检索 命中 。 或 运算 符 (|) 表示 目标 文本 中 
必须 出 现 两 个 词 中 的 至 少 一 个 就 算 检索 命中 。 如 果 使 用 的 配置 库 查 到 其 中 的 某 个 关键 词 拥 
有 多 个 词 干 ， 那 么 最 终 的 向 量化 结果 中 会 用 | 运算 符 把 这 些 词 干 连接 到 一 起 呈现 。 





























在 对 检索 条 件 进行 向 量化 处 理 时 ， 使 用 的 配置 库 应 该 与 对 原始 文本 向 量化 时 
使 用 的 配置 库 相 同 。 


plainto_tsquery 是 to_tsquery 的 变种 ， 它 会 自动 在 检索 条 件 的 关键 词 之 间 加 上 & 运算 符 ， 
可 以 为 你 节省 一 点 时 间 。 语 法 如 示例 5-48 所 示 。 


示例 5-48 用 plainto_tsquery 国 数 来 构造 tsquery 向 量 
SELECT plainto_tsquery('business analytics'); 











plainto_tsquery 


'busi' & "anatLyt' 


to_tsquery 和 plainto_tsquery 仅 考 虑 关键 词 本 身 ， 不 考虑 其 先后 位 置 。 因 此 对 这 两 个 国 
数 来 说 ,，“business analytics” 和 “analytics business” 得 到 的 tsquery 结果 是 一 样 的 。 由 于 
无 法 识别 词 与 词 之 间 的 先后 顺序 ， 带 来 的 问题 就 是 用 户 只 能 搜索 单个 关键 词 。PostgreSQL 
9.6 中 为 了 解决 这 个 问题 而 引入 了 phraseto_tsquery 函数 。 在 示例 5-49 中 可 以 看 到 ， 
phraseto_tsquery 函数 的 向 量化 结果 中 在 词素 与 词素 之 间 增 加 了 距离 运算 符 ， 这 意味 着 在 
检索 目标 文本 中 business 和 analytics 两 个 词 必须 以 一 定 顺 序 出 现时 才 算 命中 。 这 样 就 从 功 
能 上 实现 了 从 单词 搜索 到 词组 搜索 的 进化 。 


示例 5-49 用 phraseto_tsquery 函数 来 构造 tsquery 向量 
SELECT phraseto_ tsquery('business analytics'); 




















phraseto_tsquery 
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SELECT phraseto_tsquery('english_hunspell','business analytics'); 


phraseto_tsquery 


'business' <-> 'analyt' | 'busy' <-> 'analyt 








你 还 可 以 直接 使 用 类 型 强 转 语法 将 文本 串 转 为 tsquery 数据 ， 这 样 就 无 须 使 用 前 面 介绍 的 





几 个 函数 ， 
法 利用 前 述 


多 个 tsque 


|| tsquery2 表达 式 的 意思 是 检索 目标 文本 要 么 满足 tsqueryl 条 件 ， 要 么 符合 tsquery2 条 件 。 


tsquery1 & 








语法 类 似 'business & analytics'::tsquery。 这 样 做 虽然 简单 ， 但 也 意味 着 无 
函数 提供 的 功能 ， 检 索 关键 词 不 会 被 抽取 为 词素 ， 只 会 被 简单 地 原文 复制 。 


ry 向 量 数据 可 以 使 用 或 运算 符 (11) 或 者 与 运算 符 (8&&) 连接 在 一 起 。tsquery1 























& tsquery2 表达 式 的 意思 是 检索 目标 文本 必须 同时 满足 tsqueryl 和 tsquery2 条 件 。 


示例 5-50 分 别 演示 了 这 两 种 情况 


示例 5-50 


多 个 tsquery 向 量 的 关联 


SELECT plainto tsquery('business analyst') || phraseto tsquery('data scientist'); 


tsquery 


"busi 


& 'anaLyst' | 'data' <-> 'Sscientist' 


SELECT plainto_tsquery('business analyst') && phraseto_tsquery('data scientist'); 


tsque 


'busi' 


ry 


& 'analyst' & ('data' <-> 'scientist') 





tsquery 和 tsvector 这 两 种 数据 类 型 还 支持 其 他 一 些 运算 符 ， 比 如 判定 一 个 向 量 值 是 否 是 


另 一 个 向 


量 值 的 子 集 等 。 详 情 请 参考 官方 手册 中 “全 文 检 索 函 数 和 运算 符 ” 一 市 的 内 容 。 





5.8.4 


使 用 全 文 检索 





前 面 已 经 为 原始 文本 创建 好 了 tsvector 向 量 数据 ， 也 为 检索 条 件 创 建 好 了 tsquery 向 量 数 





示例 5-51 
SELEC 
FROM 
WHERE 
title 
ALASK 
CAUSE 
CINCI 


COMMANDMENTS EXPRESS 


DAUGH 
GOLDF 











据 ， 现 在 可 以 真正 地 执行 例文 检索 了 。FTS 检索 使 用 的 是 @@ 运算 符 ， 如 示例 5-51 所 示 。 





进行 FTS 检索 
T _ Left(tittLe,50) As title, left(description,50) as description 
film 
fts QQ to_ tsquery('hunter & (scientist | chef)') AND title > ''; 
| description 
A PHANTOM A Fanciful Saga of a Hunter And a Pastry Chef who 
NATTI WHISPERER A Brilliant Saga of a Pastry Chef And a Hunter who 


A Fanciful Saga of a Student And a Mad Scientist w 
A Beautiful Tale of a Hunter And a Mad Scientist w 
A Insightful Drama of a Mad Scientist And a Hunter 


TER MADIGAN 


+ 
| 

DATE | A Taut Tale of a Explorer And a Pastry Chef who mu 
| 
| 
| 

INGER SENSIBILITY | 
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HATE HANDICAP | A Intrepid RefLection of a Mad Scientist And a Pio 


INSIDER ARIZONA | A Astounding Saga of a Mad Scientist And a Hunter 
WORDS HUNTER | A Action-Packed Reflection of a Composer And a Mad 
(9 rows) 


示例 5-51 中 查 出 了 所 有 title 和 description 字段 中 含有 hunter 这 个 词 ， 并 且 还 含有 scientist 
或 者 chef 这 两 个 单词 中 的 一 个 或 者 两 个 的 所 有 电影 。 
如 果 你 当前 使 用 的 是 PostgreSQL 9.6， 那 么 还 可 以 指定 检索 条 件 内 部 的 关键 词 之 间 的 接近 
度 和 出 现 的 先后 顺序 ， 如 示例 5-52 所 示 。 
示例 5-52 指定 了 关键 词 先后 顺序 和 接近 度 的 FTS 检索 

SELECT Left(tittLe,50) As title, left(description,50) as description 


FROM film 
WHERE fts QQ to_tsquery('hunter <4> (scientist | chef)') AND title > ''; 



































title | description 

Sr a ee ea pn he he de ed eb 
ALASKA PHANTOM | A Fanciful Saga of a Hunter And a Pastry Chef who 

DAUGHTER MADIGAN | A Beautiful Tale of a Hunter And a Mad Scientist w 
(2 rows) 





示例 5-52 中 要 求 hunter 在 scientist 或 者 chef 之 前 ， 而 且 它 们 之 间 必 须 相 差 4 个 词 。 


5.8.5 ”对 检索 结果 进行 排序 


FTS 支持 对 检索 结果 进行 排序 ， 具 体 是 通过 ts_rank 和 ts_rank_cd 这 两 个 函数 来 实现 的 。 
ts_rank 函数 只 考虑 检索 关键 词 在 目标 文本 中 出 现 的 频率 和 权重 ,而 ts_rank_cd (cd 代表 
coverage density， 即 覆盖 密度 ) 还 考虑 了 关键 词 在 目标 文本 中 出 现 的 位 置 。 检 索 条 件 中 的 
词素 在 被 检索 文本 中 出 现 的 位 置 越 靠近 ， 则 该 条 检索 结果 的 相关 度 越 高 ， 最 终 排 名 越 靠 
前 。 只 有 当 原 始 文本 的 tsvector 向 量 数据 中 带 有 位 置 标 记 时 ， 使 用 ts_rank_cd 函数 才 有 
意义 ， 因 为 没有 位 置 标记 的 情况 下 根本 无 法 计算 检索 关键 词 之 间 的 距离 ， 此 时 该 函数 的 
返回 值 是 0。 另外 ， 我 们 很 容易 就 能 想到 检索 关键 词 出 现 的 频率 也 需要 根据 位 置 标记 才能 
计算 出 来 。 因 此 ， 如 果 被 检索 的 原始 文本 的 tsvector 向 量 数据 中 没有 提供 位 置 标 记 的 话 ， 
ts_rank 函数 就 只 能 依赖 权重 来 排名 了 。 默 认 情况 下 ，ts_rank 和 ts_rank_cd 函数 在 计算 过 
程 中 会 将 权重 值 A、B、C、D 映射 为 1.0、0.4、0.2 和 0.1， 之 后 再 进行 计算 。 示 例 5-53 使 
用 了 默认 的 排序 参数 。 


示例 5-53 ”对 检索 结果 进行 排序 
SELECT title, left(description,50) As description, 
ts_rank(fts,ts)::numeric(10,3) AS r 
FROM film, to_tsquery('english','love & (wait | indian | mad)') AS ts 
WHERE fts QQ ts AND title > '' 
ORDER BY r DESC; 







































































title | description Ir 
me ee a 
INDIAN LOVE | A Insightful Saga of a Mad Scientist And a Mad Sci | 0.999 
LAWRENCE LOVE | A Fanciful Yarn of a Database Administrator And a | 0.252 
(2 rows) 











假设 我 们 希望 只 有 当 检 索 条 件 字段 出 现在 title 字段 中 时 才 算 命中 ， 那 么 我 们 可 以 将 
title 的 权重 值 设 置 为 1， 其 他 字段 的 权重 值 都 设 为 0。 接 下 来 用 示例 5-54 再 实现 一 遍 示 
例 5-53 相同 的 检索 逻辑 ， 唯 一 的 差别 是 这 次 传人 了 一 组 权重 值 。 


示例 5-54 使 用 用 户 自 定义 的 权重 值 来 对 检索 结果 进行 排序 

SELECT 
left(title,40) As title, 
ts_rank('{0,0,0,1}'::numeric[],fts,ts)::numeric(10,3) AS r， 
ts_rank_cd('{0,0,0,1}'::numeric[],fts,ts)::numeric(10,3) As rcd 

FROM film, to_tsquery('english', 'love & (wait | indian | mad )') AS ts 

WHERE fts QQ ts AND title > "'' 

ORDER BY r DESC; 












































title |r | rcd 

ee oe 
INDIAN LOVE | 0.991 | 1.000 
LAWRENCE LOVE | 0.000 | 0.000 


(2 rows) 


请 注意 : 上 面 输出 的 第 二 行 结 果 中 的 rank 值 都 是 0， 这 是 因为 该 记录 的 title 字段 内 容 并 
不 完全 满足 tsquery 条 件 的 要 求 。 


如 果 你 对 检索 性 能 非常 在 意 ， 那 么 我 们 建议 在 查询 语句 中 显 式 地 指明 FTS 配 
置 库 ， 而 不 要 依赖 默认 值 。 根 据 Oleg Bartunov 的 博文 “Some FTS Tricks” 
中 的 介绍 ， 使 用 to_tsquery('english','social & (science | scientist)') 
这 种 写法 会 比 使 用 to_tsquery('social & (science| scientist)') 这 种 写法 
快 一 倍 。 


5.8.6 ”全 文 检索 向 量 信息 的 裁减 
默认 情况 下 ， 对 原始 文本 进行 向 量化 处 理 时 会 自动 加 上 位 置 标记 ( 即 词素 在 原始 文本 中 出 
现 的 位 置 ) 以 及 可 选 的 权重 值 (A、B、C、 DD 四 档 ) 信息 。 但 如 果 你 的 检索 目标 是 只 要 匹 
配 了 检索 条 件 中 的 关键 词 就 可 以 ， 而 完全 不 关心 这 些 结果 中 关键 词 出 现 的 位 置 、 出 现 的 频 
率 以 及 重要 性 ， 那 么 你 完全 可 以 用 strip 函数 对 tsvector 向 量 数据 进行 裁减 ， 这 样 可 以 而 
省 磁盘 空间 ， 也 可 以 提升 查询 速度 。 示 例 5-55 比较 了 裁减 前 和 裁减 后 向 量 数据 的 差异 。 
示例 5-55 ”裁减 前 和 裁减 后 向 量 数据 的 比较 

SELECT fts 


FROM film 
WHERE film id = 1; 














'academi':1A 'battl':15B 'canadian':20B 'dinosaur':2A 'drama':5B 'epic':4B 
'feminist':8B 'mad':11B 'must':14B 'rocki':21B 'scientist':12B 'teacher':17B 


SELECT strip(fts) 
FROM film 
WHERE film id = 1; 


'academi' 'battl' 'canadian' 'dinosaur' 'drama' 'epic' 'feminist' 'mad'’ 
'must' 'rocki' 'scientist' "teacher ' 
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请 务必 牢记 : 虽然 裁减 后 的 tsvector 向 量 数据 查询 起 来 更 快 ， 占 用 磁盘 空间 更 少 ， 但 很 多 
运算 符 和 函数 都 不 支持 与 这 种 裁减 后 的 向 量 数据 配合 使 用 。 例 如 ， 由 于 裁减 后 的 向 量 数据 
中 不 含 位 置 标 记 信息 ， 因 此 就 不 可 以 对 其 使 用 距离 运算 符 。 


5.8.7 ”全文 检 索 机 制 对 JSON 和 JSONB 数 据 类 型 的 支持 


PostgreSQL 10 中 为 ts_headline 和 to_tsvector 国 数 新 增 了 可 以 处 理 json 和 jsonb 数据 的 
版 本 。 这 两 个 函数 的 json/jsonb 入 参 版 本 的 使 用 方式 与 其 text 入 参 版 本 的 用 法 完全 相同 ， 
唯一 值得 注意 的 地 方 是 它们 仅 处 理 json/jsonb 数据 中 的 value 部 分 ， 而 不 会 关注 key 部 分 
以 及 json 本 身 的 那些 标记 符 。 示 例 5-56 用 这 两 个 函数 对 示例 5-28 中 创建 的 表 中 的 person 
字段 进行 了 处 理 。 

示例 5-56 ”对 json/jsonb 数据 进行 tsvector 向 量化 处 理 


SELECT to_tsvector(person) 
FROM persons WHERE id=1; 

















to_tsvector 


'-5083':19 '-6719':13 '-722':12 '-852':18 '619':11,17 'alex':3 'azaleah':25 
'brandon':21 'cell':15 'm':23 'ofelia':7 'rafael':5 'sonia':1 'work':9 
(1 row) 

上 例 演示 的 是 处 理 json 类 型 ， 如 果 要 演示 处 理 jsonb 类 型 ， 只 需 把 脚本 中 的 person 换 成 
person_b 即 可 。json、jsonb 入 参 版 本 的 ts_headline 和 to_tsvector 函数 各 自 还 有 一 个 变 体 ， 
其 第 一 个 参数 可 用 于 指定 用 哪个 FTS 配置 库 ， 这 个 特点 与 text 入 参 版 本 的 ts_headline 和 
to_tsvector 国 数 完 全 相同 。 为 了 更 好 地 利用 这 些 国 数 的 能 力 ， 我 们 推荐 的 做 法 是 在 被 检 
索 的 json/jsonb 数据 所 在 的 表 上 先 增加 tsvector 癌 量 字 段 ， 然 后 创建 触发 器 在 修改 时 自 
动 生成 或 者 在 需要 时 手工 生成 向 量 数据 。 
如 前 所 述 ，ts_headline 函数 也 有 了 支持 json/jsonb 入 参 的 版 本 ,该 函数 的 功能 是 将 json/ 
jsonb 数据 中 所 有 命中 的 文本 都 标记 为 HTML 格式 。 示 例 5-57 对 JSON 文档 数据 中 所 有 的 
Rafael 文本 都 做 了 标记 。 


示例 5-57 对 检索 命中 的 文本 打上 标记 
SELECT ts_headline(person->'spouse'->'parents', 'rafael'::tsquery) 
FROM persons_b WHERE id=1; 






































{"father": "<b>Rafael</b>", "mother": "Ofelia"} 
(1 row) 


请 注意 ， 上 面 输出 的 命中 结果 前 后 已 打上 了 HTML 的 <b> 标签 


5.9 自 定 义 数据 类 型 和 复合 数据 类 型 


本 节 将 介绍 如 何 定义 和 使 用 自 定 义 数 据 类 型 。composite (也 称 为 record、row) 风光 
需要 转 为 自 定 义 数据 类 型 的 对 象 或 者 是 作为 需要 返回 多 个 字段 的 函数 的 返回 值 类 型 定 


























5.9.1 所 有 表 都 有 一 个 对 应 的 自 定义 数据 类 型 
PostgreSQL 在 建 表 时 会 自动 创建 一 个 与 表 结 构 完全 相同 的 自 定义 数据 类 型 ， 而 且 这 种 类 
型 与 其 他 的 原生 数据 类 型 在 使 用 上 毫 无 区 别 。 可 以 在 建 表 时 指定 某 字段 为 表 类 型 或 者 表 
数组 类 型 ， 也 就 是 说 可 以 把 一 张 表 的 字段 定义 为 另 一 张 表 。 这 种 将 表层 层 赂 套 的 用 法 与 
“turducken”( 特 大 哺 )“ 很 像 。 在 示例 5-58 中 ， 我 们 将 用 “特大 哺 ” 的 例子 来 演示 。 
示例 5-58 为 “特大 哺 ” 建 岁 套 表 

CREATE TABLE chickens (id integer PRIMARY KEY); 


CREATE TABLE ducks (id integer PRIMARY KEY, chickens chickens[]); 
CREATE TABLE turkeys (id integer PRIMARY KEY, ducks ducks[]); 





























INSERT INTO ducks VALUES (1, ARRAY[ROW(1)::chickens, ROW(1)::chickens]); 
INSERT INTO turkeys VALUES (1, array(SELECT d FROM ducks d)); 


上 面 我 们 直接 在 ducks 表 的 一 条 记录 的 chickens 字段 中 插入 了 两 条 chickens 记录 ， 这 
种 情况 下 这 两 条 记录 的 构造 不 受 chickens 表 定 义 的 约束 ， 因 此 即使 它们 的 主键 重复 也 没 
关系 。 我 们 生成 了 两 条 chickens 记录 ， 填 入 ducks 表 中 ， 然 后 将 这 条 ducks 记录 填 入 到 


turkeys 表 中 ， 这 个 过 程 相当 于 把 两 只 chicken 塞 入 一 只 duck， 然 后 再 把 这 只 duck 塞 入 一 
只 turkey， 跟 制作 “特大 哨 ” 的 过 程 是 完全 一 样 的 。 


后 看 一 下 得 到 的 turkeys 记录 是 什么 样子 的 : 


SELECT * FROM turkeys; 











output 


1 1 {"(1,\"{(1), 1 ) 


和 嵌 套 表 中 内 和 骨 的 表 记 录 是 可 以 进行 修改 的 。 例 如 ， 我 们 要 对 第 一 个 turkey 内 风 的 第 二 个 
chicken 进行 修改 ， 那 么 可 以 执行 如 下 操作 : 


UPDATE turkeys SET ducks[1].chickens[2] = ROW(3)::chickens 
WHERE id = 1 RETURNING *; 


id | ducks 
tN 克 有 的 局 


1 | ft ,3)}\")"} 


我 们 使 用 RETURNING 子 句 来 返回 本 次 更 新 操作 涉及 的 所 有 记录 ， 我 们 将 在 7.2.10 节 中 介绍 
RETURNING 子 句 的 用 法 。 

一 个 复合 类 型 的 记录 行 或 者 字段 不 管 其 内 部 结构 有 多 么 复杂 ， 都 可 以 被 转换 为 一 个 json 或 
者 jsonb 类 型 的 字段 ， 语 法 如 下 : 








注 3: turducken 是 turkey-duck-chicken 的 简称 ， 是 一 种 美食 新 吃 法 : 将 无 骨 鸡 填 到 无 骨 鸭 的 肚子 里 ， 然 后 再 
将 填 了 无 骨 鸡 的 无 骨 鸭 填 到 无 骨 火 鸡 的 肚子 里 。 这 种 食物 很 好 地 体现 了 多 层 杠 套 的 关系 。 一 一 译 者 注 
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SELECT id，to_jsonb(ducks) AS ducks_jsonb 
FROM turkeys; 


id | ducks_jsonb 

TH 1 chickens Ti 1}, tid 3)1)] 

(1 row) 
PostgreSQL 内 部 维护 着 数据 库 对 象 之 间 的 依赖 关系 。 前 述 ducks 表 的 chickens 字段 依赖 于 
chickens 表 ，turkeys 表 的 ducks 记录 依赖 于 ducks 表 。 要 想 删 除 chickens 表 有 两 种 方法 ， 
要 么 在 drop 语句 中 带 上 CASCADE 关键 字 ， 要 么 先 删除 ducks 表 中 的 chickens 字段 。 如 果 使 
用 前 一 种 方法 ， 那 么 ducks 表 的 chickens 字段 会 被 自动 删除 ， 而 且 此 过 程 中 无 告警 信息 。 
相应 地 ，turkeys 表 的 ducks 字段 的 定义 也 将 自动 跟着 改变 。 


5.9.2 ”构建 自 定义 数据 类 型 
尽管 仅仅 通过 创建 表 就 可 以 轻松 创建 复合 数据 类 型 ， 但 有 时 候 我 们 仍 需要 从 头 开始 构建 自 
己 的 数据 类 型 。 例 如 ， 使 用 以 下 语句 可 以 构建 一 个 复数 数据 类 型 : 

CREATE TYPE complex_number AS (r double precision, i double precision); 
可 以 将 此 类 型 作为 字段 类 型 定义 使 用 : 

CREATE TABLE circuits (circuit id serial PRIMARY KEY, ac_volt complex_number); 
可 以 使 用 如 下 语法 对 这 个 表 进 行 查询 : 

SELECT circuit id, (ac_volt).* FROM circuits; 
这 种 语法 也 可 以 : 

SELECT circuit id, (ac_volt).r, (ac_volt).i FROM circuits; 
你 可 能 会 问 ， 上 面 语句 中 ac_volt 外 面 为 什么 要 加 括号 ”如果 不 加 的 话 ， 
PostgreSQL 会 报错 说 FROM 子 句 中 找 不 到 ac_volt 这 张 表 。 根 据 这 一 点 就 很 好 
理解 了 ， 加 括号 是 为 了 不 让 PostgreSQL 将 其 理解 为 表 名 。 


5.9.3 复合 类 型 中 的 空 值 处 理 

在 ANSI SQL 标准 中 ， 两 个 NULL 值 之 间 不 允许 进行 “ 值 相等 ”( 即 NULL=NULL) 或 者 “ 值 
不 等 ”( 即 NULL != NULL) 判定 ， 这 一 点 经 常会 给 用 户 带 来 理解 上 的 困难 。 当 处 理 NULL 
值 时 ， 需 要 使 用 IS NULL、IS NOT NULL 或 者 NOT (somevalue IS NULL) 这 种 表达 方 
式 。 对 于 基础 数据 类 型 来 说 ，something IS NULL 就 是 something IS NOT NULL 的 反 义 表达 
式 ， 但 对 于 复合 数据 类 型 来 说 却 并 不 是 这 样 。 

PostgreSQL 在 处 理 NULL 值 时 严格 遵循 ANSI SQL 标准 ， 其 中 规定 : 复合 数据 类 型 值 的 
IS NULL 判定 要 想 成 立 ， 其 前 提 是 该 复合 数据 类 型 值 的 每 一 个 元 素 都 是 NULL， 这 很 合 
理 。 但 接 下 来 就 有 点 “不 太 合 理 ” 了 ， 复 合 数据 类 型 值 的 IS NOT NULL 判定 要 想 成 立 ， 
前 提 是 该 复合 数据 类 型 值 的 每 一 个 元 素 都 是 NULL， 而 不 是 说 只 需 其 中 任何 一 个 元 素 不 为 
NULL 即 可 。 这 里 特别 容易 出 错 ， 因 此 请 牢记 此 规则 。 
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5.9.4 为 自 定义 数据 类 型 构建 运算 符 和 函数 


在 构建 自 定义 数据 类 型 后 ， 你 自然 就 需要 为 其 创建 相应 的 函数 和 运算 符 。 接 下 来 将 演示 如 
何 为 complex_number 类 型 创建 一 个 + 运算 符 ， 而 创建 处 理 函 数 的 方法 将 在 第 8 章 中 介绍 。 
前 面 已 经 介绍 过 ， 每 个 运算 符 都 有 一 个 底层 实现 函数 ， 该 函数 需要 一 个 或 者 两 个 参数 ， 运 
算 符 就 是 这 个 函数 的 符号 化 别名 。 在 PostgreSQL 官方 手册 的 “创建 运算 符 ” 一 节 中 ， 你 可 
以 看 到 系统 允许 使 用 哪些 字符 来 定义 新 的 运算 符 。 


运算 符 不 仅仅 是 其 底层 实现 函数 的 别名 ， 它 还 可 以 提供 一 些 可 以 帮助 规划 器 更 好 工作 的 优 
化 信息 ， 规 划 器 借助 这 些 信息 可 以 判定 如 何 使 用 索引 ， 如 何以 最 低 的 成 本 访问 数据 ， 以 及 
哪些 运算 符 表达 式 是 等 价 的 。 这 些 信息 的 完整 列表 以 及 每 一 类 信息 的 具体 作用 ， 可 以 参考 
官方 手册 中 “运算 符 的 优化 信息 ”一 市 的 内 容 。 


创建 运算 符 的 第 一 步 是 创建 其 底层 实现 函数 ， 如 示例 5-59 所 示 。 


示例 5-59 ”为 complex_number 创建 底层 实现 函数 
CREATE OR REPLACE FUNCTION add(complex_number, complex_number) 
RETURNS complex_number AS 
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$$ 
SELECT 
((COALESCE(($1).r,0) + COALESCE(($2).r,0)), 
(COALESCE(($1).i,0) + COALESCE(($2).i,0)))::complex_number; 
$$ 


Language sql; 
接 下 来 要 创建 一 个 运算 符 来 代表 此 函数 ， 如 示例 5-60 所 示 。 


示例 5-60 ”为 complex_number 类 型 定义 + 运算 符 
CREATE OPERATOR + ( 
PROCEDURE = add, 
LEFTARG = complex_number, 
RIGHTARG = complex_number, 
COMMUTATOR = + 
); 
然后 我 们 测试 一 下 这 个 新 的 + 运算 符 : 
SELECT (1,2)::compLex_number + (3,-10)::complex_number; 


输出 结果 是 (4,-8)。 


虽然 我 们 在 此 处 没有 举例 说 明 ， 但 你 可 以 对 函数 和 运算 符 进行 重 载 ， 以 使 其 可 以 接受 多 种 
不 同类 型 的 输入 。 例 如 ， 你 可 以 创建 一 个 支持 complex_number 和 integer 相 加 的 add 函数 
和 相应 的 + 计算 符 ， 这 就 实现 了 对 原 逻 辑 的 扩展 。 
支持 自 定义 数据 类 型 和 运算 符 让 PostgreSQL 从 机 制 上 具有 了 自我 演进 的 能 力 ， 开 源 社区 无 
数 开 发 人 员 利 用 此 能 力 为 PostgreSQL 平台 添砖加瓦 。 随 着 这 个 开发 平台 的 羽 村 日 渐 丰 满 ， 
我 们 离 “ 一 切 皆 以 表 驱 动 ” 的 理想 境界 也 越 来 越 近 。 
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第 6 章 


表 、 约 束 和 索引 





表 是 关系 型 数据 库存 储 体系 的 基本 单元 。 设 计 好 结构 化 的 表 并 且 定 义 表 与 表 之 间 的 关联 关 
系 是 关系 型 数据 库 的 核心 设计 思想 。 在 PostgreSQL 中 ， 约 束 定义 了 表 与 表 之 间 的 关系 。 与 
以 堆 结构 存储 的 记录 相 比 ， 表 的 优势 就 在 于 有 索引 。 你 会 在 很 多 书 的 末尾 看 到 词汇 索引 
表 ， 也 会 在 写字 楼 的 大 堂 看 到 每 层 楼 的 租户 名 单 ， 表 索引 的 作用 与 它们 类 似 ， 即 在 表 中 快 
速 查找 到 目标 数据 的 位 置 ， 这 样 就 不 用 每 次 查询 时 都 扫描 整 张 表 的 内 容 。 


本 章 将 介绍 创建 表 和 插入 记录 的 语法 。 然 后 将 介绍 约束 的 用 法 ， 约 束 可 以 保证 数据 库 的 记 
孙 不 会 违反 我 们 制定 的 规则 。 最 后 将 展示 如 何 为 表 创 建 索引 来 加 速 查询 。 在 表 上 创建 索引 
是 需要 经 过 深思 熟 虑 的 ， 因 为 一 个 错误 的 索引 会 导致 查询 效果 比 全 表 扫 描 还 差 ， 也 就 是 说 
创建 了 还 不 如 不 创建 。 并 不 是 所 有 的 索引 都 是 “生来 平等 ”的 ， 数 据 库 领 域 的 算法 专家 为 
不 同 的 数据 类 型 设计 出 了 不 同类 型 的 索引 ， 目 的 是 将 查询 的 速度 提升 到 极致 。 


6.1 表 


除了 普通 的 表 以 外 ，PostgreSQL 还 提供 了 许多 不 常见 的 表 ， 有 具体 包括 临时 表 、 无 日 志 表 、 
继承 表 、 基 于 复合 类 型 的 表 以 及 外 部 表 (第 10 章 将 介绍 外 部 表 ) 。 


6.1.1 基本 的 建 表 操作 
示例 6-1 演示 了 建 表 语法 ， 在 所 有 支持 SQL 的 数据 库 中 建 表 语 法 都 是 类 似 的 。 
示例 6-1 基本 的 建 表 操 作 


CREATE TABLE Logs ( 

Log_id serial PRIMARY KEY, © 
user_name varchar(50), @ 
description text, © 
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Log_ts timestamp with time zone NOT NULL DEFAULT current_timestamp 
); ©@ 
CREATE INDEX idx_Logs_Log_ts ON Logs USING btree (log_ts); 

@ serial 数据 类 型 是 一 种 自 增长 的 数字 类 型 。 建 表 时 如 果 有 一 个 serial 类 型 的 字段 ， 那 
么 系统 会 自动 在 schema 中 同时 创建 一 个 对 应 的 序列 号 生成 器 。serial 类 型 字段 的 值 是 
一 个 整 型 数字 ， 它 会 自动 被 赋值 为 序列 号 生成 器 的 下 一 个 值 。 每 张 表 一 般 来 说 只 会 有 
个 serial 字段 ， 且 一 般 用 作 主 键 。 对 于 特别 大 的 表 ， 应 该 使 用 bigserial 类 型 ， 因 为 
它 能 容纳 的 数值 上 限 更 大 。 

@ varchar 是 character varying (可 变 长 字符 串 ) 的 简写 ， 其 定义 与 其 他 数据 库 产品 中 的 定 
义 类 似 。 你 可 以 不 为 varchar 字段 设 定 最 大 长 度 值 ， 此 时 它 与 text 类 型 几乎 是 一 样 的 。 

@ text 是 一 种 不 定 长 度 的 字符 串 ， 无 最 大 长 度 限制 。 

@ timestamp with time zone (可 简写 为 timestamptz) 是 一 种 表示 日 期 和 时 间 的 类 型 ， 总 
是 以 国际 标准 时 间 (UTC) 格式 存储 。 该 类 型 在 显示 时 总 是 以 服务 器 当前 所 在 时 区 为 基 

准 进行 显示 ， 当 然 你 也 可 以 要 求 使 用 指定 的 时 区 进行 显示 。 更 多 关于 此 类 型 的 讨论 ， 请 
参考 5.3.1 节 。 

PostgreSQL 10 中 新 增 了 对 IDENTITY 关键 字 的 支持 。IDENTITY 也 可 以 将 字段 定义 为 自 增 序 

列 号 类 型 ， 这 是 一 种 更 加 符合 标准 的 语法 。 

你 可 以 将 现 有 的 Log_id 字段 的 serial 类 型 修改 为 IDENTITY 类 型 。 与 serial 不 同 的 是 ， 

IDENTITY 类 型 的 底层 不 再 借助 一 个 自动 生成 的 序列 号 生成 器 。 语 法 如 下 : 

DROP SEQUENCE Logs_Log_id_seq CASCADE; 


ALTER TABLE Logs 
ALTER COLUMN log_id ADD GENERATED BY DEFAULT AS IDENTITY; 


如 有 果 此 表 中 已 有 数据 ， 需 要 防止 序列 号 再 次 从 1 生成 从 而 造成 重复 ， 语 法 如 下 : 


ALTER TABLE Logs 
ALTER COLUMN log_id RESTART WITH 2000; 


如 果 是 创建 新 表 ， 要 按照 如 示例 6-2 所 示 的 IDENTITY 语法 创建 表 ， 不 用 原来 的 serial 
语法 。 
示例 6-2 使 用 IDENTITY 语法 创建 表 

CREATE TABLE Logs ( 

log_id int GENERATED BY DEFAULT AS IDENTITY PRIMARY KEY, 

User_name varchar(50), 

description text, 


Log_ts timestamp with time zone NOT NULL DEFAULT current_ timestamp 
); 


示例 6-2 的 语法 结构 与 示例 6-1 基本 相同 ， 只 是 更 详细 。 

那么 在 什么 情况 下 应 该 使 用 IDENTITY 末代 serial 呢 ? IDENTITY 语法 的 主要 优点 在 于 一 
个 identity 总 是 与 所 属 表 绑 定 的 ， 其 值 的 递增 或 者 重 置 都 是 与 表 本 身 一 体 化 管理 的 ， 不 会 
受 其 他 对 象 干扰 。seriat 类 型 则 不 是 这 样 ， 它 会 在 后 台 自 动 创建 一 个 序列 号 生成 器 ， 这 
个 序列 号 生成 器 可 以 与 别 的 表 共 享 也 可 以 本 表 独 享 ， 当 不 需要 该 序列 号 生成 器 时 需要 手动 
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删除 它 。 如 果 你 需要 重 置 一 个 serial 类 型 字段 的 初始 值 ， 需 要 修改 后 台 那 个 自动 生成 的 
序列 号 生成 器 ， 这 也 意味 着 得 先知 道 那个 序列 号 生成 器 的 名 字 。 很 显然 ， 这 个 管理 过 程 比 
IDENTITY 要 繁琐 很 多 。 

当 需 要 在 多 张 表 之 间 共 享 一 个 递增 序列 号 时 ，serial 类 型 依然 是 很 有 用 的 。 这 种 情况 下 ， 
需要 创建 一 个 独立 的 序列 号 生成 器 ， 并 把 需要 共享 该 序列 的 每 张 表 的 相应 字段 的 默认 值 设 
为 该 序列 号 生成 器 的 下 一 个 值 。 从 内 部 实现 机 制 来 看 ，IDENTITY 语法 与 serial 类 型 的 做 法 
其 实 是 类 似 的 ， 都 是 自动 创建 一 个 序列 号 生成 器 ， 只 不 过 IDENTITY 不 会 将 这 个 序列 号 生成 
器 对 象 暴露 给 外 界 去 修改 。 


6.1.2 ”继承 表 


PostgreSQL 是 唯一 提供 表 继 承 功 能 的 数据 库 。 如 果 创 建 一 张 表 ( 子 表 ) 时 指定 为 继承 
自 另 一 张 表 ( 父 表 )， 则 建 好 的 子 表 除了 含有 自己 的 字段 外 还 会 含有 父 表 的 所 有 字段 。 
PostgreSQL 会 记录 下 这 个 继承 关系 ， 这 样 一 旦 父 表 的 结构 发 生 了 变化 ， 子 表 的 结构 也 会 自 
动 跟 着 变化 。 这 种 父子 继承 结构 的 表 可 以 完美 地 适用 于 需要 数据 分 区 的 场景 。 当 查询 父 表 
时 ，PostgreSQL 会 自动 把 子 表 的 记录 也 取出 来 。 值 得 注意 的 是 ， 并 不 是 所 有 父 表 的 特征 都 
会 被 子 表 继 承 下 来 ， 比 如 主 表 的 主键 约束 、 唯 一 性 约束 以 及 索引 就 不 会 被 继承 。check 约 
会 被 继承 ， 但 子 表 还 可 以 另 建 自己 的 check 约束 〈 详 见 示例 6-3)。 
示例 6-3 ”创建 继承 表 
CREATE TABLE Logs_2011 (PRIMARY KEY (log id)) INHERITS (logs); 
CREATE INDEX idx_logs_2011_log_ ts ON Logs_2011 USING btree(log_ts); 
ALTER TABLE logs_2011 
ADD CONSTRAINT chk_y2011 
CHECK ( 
log ts >= '2011-1-1'::timestamptz AND Log_ts < '2012-1-1'::timestamptz 
); 上 
@ 我 们 定义 了 一 个 check 约束 来 限制 只 能 录入 2011 年 的 数据 。 该 check 约束 告诉 查询 规 
划 器 在 查询 父 表 时 跳 过 不 满足 条 件 的 子 表 。 


PostgreSQL 9.5 新 增 支持 了 在 本 地 表 和 外 部 表 之 间 做 表 继 承 ， 而 且 可 以 互相 继承 。 文 持 该 
特性 主要 是 为 了 实现 表 的 分 布 式 存储 。 


6.1.3 原生 分 区 表 支 持 
PostgreSQL 10 中 增加 了 对 原生 分 区 表 功 能 的 支持 。 原 生 分 区 表 从 使 用 上 看 与 之 前 的 表 继 承 
功能 非常 类 似 ， 都 允许 把 数据 切 分 到 多 张 独立 的 子 表 中 ， 并 且 规 划 器 会 选择 性 地 跳 过 不 符 
合 查询 条 件 的 子 表 。 从 内 部 实现 机 制 看 ， 二 者 是 非常 像 的 ， 只 不 过 使 用 的 DDL 语法 不 同 。 
尽管 在 很 多 场景 下 分 区 表 都 可 以 替代 原来 的 表 继 承 功能 ， 但 还 不 能 完全 替代 。 以 下 是 表 继 
承 和 分 区 表 这 两 个 功能 的 关键 区 别 。 
。 分 区 表 使 用 声明 式 的 CREATE TABLE .PARTITION BY RANGE .. 语法 ， 后 台 会 默认 创建 一 
个 分 区 表 组 。 




















































































































。 使 用 分 区 表 时 ， 如 果 对 主 表 插入 数据 ， 记 录 会 按照 分 区 规则 被 路 由 到 相应 的 分 区 中 。 但 
使 用 表 继 承 时 情况 就 不 是 这 样 ， 你 需要 直接 把 数据 插入 正确 的 子 表 中 ， 或 者 在 主 表 上 挂 
载 触发 器 来 把 记录 路 由 到 子 表 中 。 

。 分 区 表 的 所 有 子 分 区 都 必须 具备 相同 的 字段 结构 ， 而 表 继 承 中 的 子 表 完 全 可 以 比 父 表 拥 
有 更 多 字段 。 

。 分 区 表 的 每 个 分 区 都 隶属 于 一 个 共同 的 分 区 表 组 ， 这 意味 着 它们 只 能 有 一 个 父 表 ， 然 而 
表 继 承 功能 中 的 一 张 子 表 可 以 继承 自 多 个 父 表 。 

。 分 区 表 的 父 表 是 一 个 逻辑 对 象 而 非 物理 实体 ， 因 此 它 上 面 不 可 以 定义 主键 、 唯 一 键 或 者 
索引 ， 但 是 每 个 子 分 区 可 以 定义 这 些 。 表 继承 机 制 中 的 情况 与 此 不 同 : 父 表 和 每 个 子 表 
都 可 以 有 主键 , 而且 主键 只 需 在 本 表 内 部 唯一 即 可 ,并 不 一 定 要 在 所 有 子 表 范 围 内 都 唯一 。 

。 与 表 继 承 机 制 中 的 父 表 不 同 ， 分 区 表 的 父 表 不 能 存储 自己 的 记录 。 所 有 针对 父 表 插 入 的 
记录 都 会 被 路 由 到 相应 的 子 分 区 中 ， 如 果 没 有 符合 条 件 的 子 分 区 则 会 报错 。 


我 们 将 使 用 分 区 表 语 法 重建 示例 6-1 中 的 togs 表 ， 其 中 会 用 分 区 语法 来 创建 子 分 区 ， 而 不 
会 使 用 示例 6-3 所 示 的 表 继承 语法 。 


首先 ， 删 除 现 有 的 togs 表 及 其 所 有 子 表 : 


DROP TABLE IF EXISTS logs CASCADE; 


创建 分 区 表 时 ， 必 须 使 用 PARTITION BY 语法 来 表明 这 是 一 个 分 区 表 ， 语 法 如 示例 6-4 所 
示 。 可 以 对 比 看 一 下 示例 6-1， 其 中 我 们 先 创建 了 一 张 普通 表 。 另 外 ， 请 注意 我 们 并 没有 
定义 主键 ， 因 为 分 区 表 的 主 表 并 不 支持 主键 。 
示例 6-4 ”创建 分 区 表 的 主 表 

CREATE TABLE logs ( 

Log_id int GENERATED BY DEFAULT AS IDENTITY, 

user_name varchar(50), 

description text, 


log_ts timestamp with time zone NOT NULL DEFAULT current_timestamp 
) PARTITION BY RANGE (log ts); 


与 表 继 承 机 制 类 似 的 是 ， 分 区 表 机 制 中 也 需要 单独 创建 子 分 区 表 ， 不 同 之 处 是 使 用 了 FOR 
VALUES 语法 来 指明 每 张 子 表 能 容纳 的 数据 范围 ， 而 表 继 承 中 使 用 的 是 check 约束 。 我 们 在 示 
例 6-5 中 把 示例 6-3 的 内 容重 演 一 遍 ， 只 不 过 采用 的 是 FOR VALUES FROM 语法 而 非 INHERITS 
语法 。 
示例 6-5 ”创建 子 分 
CREATE TABLE logs_2011 PARTITION OF logs O@ 
FOR VALUES FROM ('2011-1-1') TO ('2012-1-1') @; 


CREATE INDEX idx_Logs_2011_Log_ts ON Logs_2011 USING btree(Log_ts); © 
ALTER TABLE Logs_2011 ADD CONSTRAINT pk_logs 2011 ”PRIMARY KEY (Log_id) @; 


@ 定义 一 张 新 表 ， 作 为 Logs 表 的 一 个 子 分 区 。 

@ 定义 该 分 区 中 能 够 存储 的 数据 范围 。 子 分 区 之 间 的 数据 存储 范围 不 能 有 重 琶 ， 如 果 违 反 
此 规则 ， 子 分 区 的 CREATE TABLE 语句 会 失败 。 

@Q@ 子 分 区 表 上 可 以 定义 索引 和 主键 。 与 表 继 承 类 似 的 是 ， 子 分 区 表 的 主键 并 不 需要 在 所 
有 子 分 区 表 中 全 局 唯一 。 
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如 果 尝 试 插入 如 下 的 记录 : 
INSERT INTO logs(user_name, description ) VALUES ('regina', 'Sleeping'); 
语句 会 因 找 不 到 合适 的 分 区 而 报 这 个 错 : 


ERROR: no partition of relation "logs" found for row 
DETAIL: Partition key of the failing row contains 
(log ts) = (2017-05-25 02:58:28.057101-04). 


接 下 来 为 当前 年 份 再 创建 一 个 分 区 : 


CREATE TABLE logs gt 2011 PARTITION OF logs 
FOR VALUES FROM ('2012-1-1') TO (unbounded); 


这 里 与 示例 6-5 不 同 的 地 方 是 使 用 了 unbounded 关键 字 来 表示 分 区 的 截止 范围 ， 这 样 将 来 
的 日 期 也 都 能 匹配 到 这 个 分 区 。 

再 执行 一 次 前 面 的 插入 语句 ， 这 次 会 成 功 。 执 行 SELECT * FROM logs_gt_2011; 查询 就 可 以 
看 到 记录 被 路 由 到 了 新 建 的 分 区 中 。 

请 注意 ， 在 实际 项 目 中 不 是 只 创建 完 分 区 就 可 以 ， 我 们 需要 针对 新 建 的 分 区 创建 索引 和 主 
键 以 提升 查询 效率 。 

与 表 继 承 机 制 类 似 的 是 ， 当 查询 父 表 时 ， 所 有 不 符合 条 件 的 子 分 区 都 会 被 跳 过 ， 如 示例 
0-0 所 示 。 

示例 6-6 规划 器 自动 跳 过 不 符合 条 件 的 分 区 


EXPLAIN ANALYZE SELECT * FROM Logs WHERE Log_ts > '2017-05-01'; 




















| 


























Append (cost=0.00..15.25 rows=140 width=162) 
(actual time=0.008..0.009 rows=1 Loops=1) 
-> Seq Scan on Logs_gt_2011 (cost=0.00..15.25 rows=140 width=162) 
(actual time=0.008..0.008 rows=1 loops=1) 
Filter: (log_ ts > '2017-05-01 00:00:00-04'::timestamp with time zone) 
Planning time: 0.152 ms 
Execution time: 0.022 ms 


如 果 你 使 用 的 是 PostgreSQL 10 自 带 的 PSQL， 针 对 分 区 表 执行 表 结 构 查 询 命 令 时 将 得 到 更 
为 详细 的 信息 ， 在 这 些 信息 中 能 看 到 每 个 分 区 能 容纳 数据 的 范围 。 
\d+ logs 














Table "public.logs" 


Partition key: RANGE (log_ts) 
Partitions: logs_2011 
FOR VALUES FROM ('2011-01-01 00:00:00-05') TO ('2012-01-01 00:00:00-05')，, 
logs_gt 2011 
FOR VALUES FROM ('2012-01-01 00:00:00-05') TO (UNBOUNDED) 


6.1.4 无 日 志 表 


对 于 发 生 磁盘 故障 或 者 系统 崩溃 后 可 以 被 重建 的 临时 数据 来 说 ， 其 操作 速度 比 可 靠 性 更 重 
要 。PostgreSQL 从 9.1 版 开始 支持 UNLOGGED 修饰 符 ， 使 用 该 修饰 符 可 以 创建 无 日 志 的 表 ， 
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如 示例 6-7 所 示 。 系 统 不 会 为 这 种 表 记 录 任 何事 务 日 志 (业界 一 般 也 称 为 WAL 日 志 ， 即 
write-ahead log)。 无 日 志 表 的 一 大 优势 是 其 写 入 记录 的 速度 远 远 超过 普通 的 有 日 志 表 ， 依 
照 我 们 的 经 验 ， 大 概 会 快 10 到 15 倍 。 


如 果 你 的 服务 器 不 小 心 被 掉 电 重启 ， 那 么 无 日 志 表 中 的 数据 会 在 事务 回 滚 过 程 中 被 全 部 请 
除 。 无 日 志 表 的 另 一 个 特性 是 它 无 法 被 纳入 PostgreSQL 的 复制 机 制 ， 因 为 复制 机 制 依赖 事 
务 日 志 。pg_dump 有 一 个 选项 可 以 允许 你 跳 过 备份 无 日 志 的 表 。 


示例 6-7 创建 无 日 志 表 
CREATE UNLOGGED TABLE web_sessions ( 
session_id text PRIMARY KEY, 
add_ts timestamptz, 
upd_ts timestamptz, 
session_state xml); 


使 用 无 日 志 表 还 有 一 些 别 的 缺点 。 在 PostgreSQL 9.3 之 前 ， 无 日 志 表 不 支持 GiST 索引 
(参考 6.3.1 节 ) ， 该 类 型 的 索引 一 般 适 用 于 高 级 的 数据 类 型 ， 比 如 数组 、 范 围 、JSON、 全 
文 检索 以 及 空间 类 型 等 。 不 过 任何 PostgreSQL 版 本 中 的 无 日 志 表 都 可 以 使 用 B- 树 索引 和 
GIN 索引 。 


在 PostgreSQL 9.5 之 前 ， 要 想 把 无 日 志 表 改 为 有 日 志 表 是 很 麻烦 的 。9.5 版 之 后 ， 只 需 执行 
以 下 命令 即 可 : 


ALTER TABLE some_table SET LOGGED; 



































6.1.5 TYPE OF 
PostgreSQL 在 创建 一 张 表 时 ， 会 自动 在 后 台 创建 一 个 结构 完全 相同 的 复合 数据 类 型 ， 反 之 
则 不 是 这 样 。 你 可 以 使 用 一 个 复合 数据 类 型 来 作为 建 表 的 模板 。 下 面 将 演示 该 功能 ， 首 先 
创建 一 个 复合 数据 类 型 。 

CREATE TYPE basic_user AS (user_name varchar(50), pwd varchar(10)); 
然后 可 以 创建 一 张 表 ， 表 结构 就 是 该 复合 类 型 ， 如 示例 6-8 所 示 。 
示例 6-8 ”以 复合 数据 类 型 为 模板 来 创建 一 张 表 


CREATE TABLE super_users OF basic_user (CONSTRAINT pk_su PRIMARY KEY (user_name)); 


当 基 于 数据 类 型 来 创建 表 时 ， 你 不 能 指定 表 字 段 的 定义 ， 一 切 以 数据 类 型 本 身 的 定义 为 准 。 
然而 ， 为 复合 数据 类 型 新 增 站 者 移 除 字段 时， PostgreSQL 会 自动 修改 相应 的 表 结构 。 这 种 
机 制 的 优点 是 ， 如 果 你 的 系统 中 有 很 多 结构 相同 的 表 ， 而 你 可 能 需要 同时 对 所 有 表 结 构 进 
行 相同 的 修改 ， 那 么 此 时 只 需要 修改 此 基础 数据 类 型 即 可 ， 这 一 点 与 表 继 承 机 制 很 相似 。 


例如 ， 如 果 需 要 为 示例 6-8 中 定义 的 super_users 表 增 加 一 个 电话 号 码 字 段 ， 那 么 只 需 执 
行 以 下 语句 即 可 。 

ALTER TYPE basic_user ADD ATTRIBUTE phone varchar(10) CASCADE; 
一 般 来 说 ， 如 果 表 依赖 于 某 个 类 型 ， 那 么 你 就 不 能 更 改 该 类 型 的 定义 。CASCADE 修饰 符 凌 
罗 于 此 限制 之 上 ， 对 所 有 相关 表 应 用 相同 的 更 改 。 
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6.2 约束 机 制 


PostgreSQL 的 约束 机 制 是 我 们 所 接触 过 的 数据 库 中 最 先进 的 ， 同 时 也 是 最 复杂 的 。 用 户 可 
以 在 创建 约束 时 定制 其 各 方面 的 属性 ， 包 括 约 束 的 名 称 、 如 何 处 理 现 有 数据 、 级 联 生效 条 
件 选项 、 如 何 执行 匹配 算法 、 使 用 哪些 索引 以 及 在 何 种 情况 下 约束 可 以 不 生效 等 。 关 于 完 
整 的 约束 规则 ， 建 议 你 查阅 PostgreSQL 官方 手册 中 的 相关 内 容 。 虽 然 约 束 机 制 中 有 大 量 的 
选项 可 供 定制 ， 但 一 般 来 说 没 那 么 复杂 ， 采 用 默认 选项 就 够 了 。 本 市 将 首先 介绍 关系 型 数 
据 库 领 域 耳 熟 能 详 的 几 个 概念 ， 包 括 外 键 约束 、 唯 一 性 约束 以 及 check 约束 ， 然 后 再 介绍 





























排他 性 约束 。 





主键 约束 和 字段 唯一 性 约束 在 表 级 范围 内 不 允许 出 现 重 名 。 一 般 比 较 推荐 的 
做 法 是 把 表 名 和 字段 名 加 入 到 约束 的 名 称 中 ， 这 样 就 不 会 重复 。 为 简洁 起 
见 ， 下 面 的 例子 中 可 能 不 会 遵循 这 种 做 法 。 














6.2.1 外 键 约束 

















与 大 多 数 支持 引用 完整 性 的 数据 库 一 样 ，PostgreSQL 遵循 与 其 相同 的 约定 。 你 可 以 指定 级 








联 更 新 和 删除 规则 以 避免 出 现 讨 大 的 孤立 记录 。 示 例 6-9 中 展示 了 如 何 添加 外 键 约束 。 
示例 6-9 ”建立 外 键 约束 和 相应 的 索引 


SET search_path=census, public; 

ALTER TABLE facts ADD CONSTRAINT fk_facts_1 FOREIGN KEY (fact_type_id) 
REFERENCES Lu_fact_types (fact type id) @ ON UPDATE CASCADE ON DELETE RESTRICT; 
@ 

CREATE INDEX fki_facts_1 ON facts (fact type id); © 


@ 我 们 在 facts 表 和 Lu_fact_types 表 之 间 定 义 了 一 个 外 键 约束 关系 。 有 了 这 个 约束 以 后 ， 





如 果 主 表 Lu_fact_types 中 不 存在 某 fact_type_id 的 记录 ， 那 么 从 表 fact 中 就 不 能 插 
入 该 fact_type_id 的 记录 。 

我 们 定义 了 一 个 级 联 规 则 ， 实 现 了 以 下 功能 : (1) 如 果 主 表 Lu_fact_type 的 fact_type_ 
id 字段 值 发 生 了 变化 ， 那 么 从 表 fact 中 相应 记录 的 fact_type_id 字段 值 会 自动 进行 相 
应 修改 ， 以 维持 外 键 引用 关系 不 变 ，(2) 如 果 从 表 fact 中 还 存在 某 fact_type_id 字段 
值 的 记录 ， 那 么 主 表 tu_fact_type 中 相同 fact_type_id 字段 值 的 记录 就 不 允许 被 删除 。 
ON DELETE RESTRICT 是 默认 行为 模式 ， 也 就 是 说 这 个 子 句 不 加 也 可 以 ， 但 为 了 清晰 起 见 





最 好 加 上 。 
@ PostgreSQL 在 建立 主键 约束 和 唯一 性 约束 时 ， 会 自动 为 相应 字段 建立 索引 ， 但 在 建 








yA 








外 键 约束 时 却 不 会 ， 这 一 点 需要 注意 。 你 需要 为 外 键 字段 手动 建立 索引 ， 以 加 快 关 联 
用 时 的 查询 速度 。 
外 键 约束 对 于 保证 数据 完整 性 是 很 重要 的 。 在 比较 新 的 PostgreSQL 版 本 中 ， 它 还 能 起 到 
助 规划 优化 处 理 逻 辑 的 作用 。 在 PostgreSQL 9.6 中 ， 规 划 器 的 一 个 改进 就 是 利用 外 键 关 
来 推断 表 关联 语句 中 谓词 的 可 选择 性 ， 提 升 了 许多 类 型 查询 的 效率 。 
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6.2.2 ”唯一 性 约束 

主键 字段 的 值 是 唯一 的 ， 但 每 张 表 只 能 定义 一 个 主键 ， 因 此 如 果 你 需要 保证 别 的 字段 值 唯 
一 ， 那 么 必须 在 该 字段 上 建立 唯一 性 约束 或 者 唯一 索引 。 建 立 唯一 性 约束 时 会 自动 在 后 台 创 
建 一 个 相应 的 唯一 索引 。 与 主键 字段 类 似 ， 建 立 了 唯一 性 约束 的 字段 可 以 作为 外 键 字 段 被 别 
的 表 引 用 ， 但 它 可 以 为 空 。 不 过 请 注意 : 建 了 唯一 索引 却 没有 唯一 性 约束 的 字段 是 可 以 输入 
空 值 的 ， 而 且 还 可 以 使 用 函数 来 定义 。 下 面 的 例子 演示 了 如 何 新 建 一 个 唯一 性 约束 。 


ALTER TABLE Logs_2011 ADD CONSTRAINT uq UNIQUE (user_name, log_ts); 


你 可 能 经 常会 遇 到 仅 需 要 保证 表 中 部 分 记录 行 唯一 的 情况 ，PostgreSQL 不 支持 带 盘 选 条 




































































6.3.4 节 。 


6.2.3 check 约束 


check 约束 能 够 给 表 的 一 个 或 者 多 个 字段 加 上 一 个 条 件 ， 表 中 每 一 行 记录 必须 满足 此 条 件 。 
查询 规划 器 也 会 利用 check 约束 来 优化 执行 速度 ， 比 如 有 些 查 询 附 带 的 条 件 与 待 查询 表 的 
check 约束 无 交集 ， 那 么 规划 器 会 立即 认定 该 查询 未 命中 目标 并 返回 。 示 例 6-3 中 就 有 一 
个 check 约束 ， 该 约束 可 以 告诉 规划 器 不 要 试图 查找 不 符合 约束 条 件 的 记录 。check 约束 
支持 基于 函数 和 布尔 表达 式 的 条 件 ， 因 此 你 可 以 发 挥 创意 编写 出 一 个 非常 复杂 的 约束 条 件 
来 。 例 如 ， 以 下 check 约束 可 以 限制 logs 表 中 所 有 用 户 名 必须 都 小 写 。 


ALTER TABLE Logs ADD CONSTRAINT chk CHECK (user_name = Lower(user_name) ); 


特别 值得 注意 的 一 点 是 ， 当 表 间 存在 继承 关系 时 ， 子 表 会 继承 父 表 的 check 约束 ， 但 主键 、 
外 键 、 唯 一 性 这 三 种 约束 却 不 会 继承 。 


6.2.4 排他 性 约束 

传统 的 唯一 性 约束 在 比较 算法 中 仅 使 用 了 “等 于 ”运算 符 ， 即 保证 了 指定 字段 的 值 在 本 表 
的 任意 两 行 记录 中 都 不 相等 ， 而 排他 性 约束 机 制 拓展 了 唯一 性 比较 算法 机 制 ， 可 以 使 用 更 
多 的 运算 符 来 进行 比较 运算 ， 该 类 约束 特别 适用 于 解决 有 关 时 间 安 排 的 问题 。 

PostgreSQL 9.2 中 引入 了 区 间 数 据 类 型 ， 该 类 型 特别 适合 使 用 排他 性 约束 。 你 可 以 在 
depesz 站 点 的 “Waiting for 9.2 Range Data Types” 这 篇 文章 中 ， 找 到 在 区 间 数 据 类 型 上 使 
用 排他 性 约束 的 非常 好 的 例子 。 


排他 性 约束 一 般 是 基于 GiST 类 型 的 索引 来 实现 的 ， 使 用 基于 B- 树 算法 的 GiST 多 列 复合 
索引 也 是 可 以 的 ， 不 过 需要 先 安装 btree_gist 扩展 包 才能 建立 这 种 索引 。 多 列 排 他 性 约束 
的 一 个 经 典 应 用 场景 就 是 用 于 安排 资源 。 

以 下 是 一 个 使 用 排他 约束 的 例子 。 假 设 你 的 办 公 场 所 有 固定 数量 的 会 议 室 ， 各 项 目 组 在 使 
会 议 室 前 必须 预订 。 示 例 6-10 演示 了 如 何 避 免 发 生 预 订 冲 突 。 该 示例 中 使 用 了 && 运算 

符 来 判定 时 间 区 段 是 否 重 琶 ， 还 使 用 了 = 运算 符 来 判定 会 议 室 房 间 号 是 否 重复 ， 请 注意 观 
察 和 思考 此 用 法 。 
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示例 6-10 ”防止 会 议 室 预订 冲突 
CREATE TABLE schedules(id serial primary key, room int, time_slot tstzrange); 
ALTER TABLE schedules ADD CONSTRAINT ex_schedules 
EXCLUDE USING gist (room WITH =, time_slot WITH &&) ; 


同 唯一 性 约束 一 样 ，PostgreSQL 会 自动 为 排他 性 约束 中 涉及 的 字段 建立 索引 。 
排他 性 约束 适用 的 另 一 个 场景 是 处 理 数组 类 型 的 数据 。 假 设 有 若干 房间 要 分 配给 一 群 人 搞 
聚会 ， 我 们 把 一 场 聚会 所 使 用 的 房间 称 为 一 个 block。 方 便 起 见 ， 我 们 为 每 个 聚会 生成 一 
条 记录 ， 但 需要 确保 两 场 聚会 不 会 共享 同一 个 房间 。 建 表 如 下 ; 

CREATE TABLE room_blocks(block_id integer primary key, rooms int[]); 


为 保证 每 两 个 block 之 间 不 会 有 共享 的 房间 ， 可 以 设置 一 个 排他 性 约束 来 防止 分 配 重 县 。 
很 遗憾 的 是 ， 排 他 性 约束 仅 对 GiST 索引 类 型 生效 ， 而 GiST 索引 又 不 支持 在 数组 上 建立 ， 
所 以 我 们 先 安 装 一 个 扩展 包 ， 如 示例 6-11 所 示 。 
示例 6-11 防止 数组 block 重 到 

CREATE EXTENSION IF NOT EXISTS intarray; 

ALTER TABLE room blocks 


ADD CONSTRAINT ex_room_bLocks_rooms 
EXCLUDE USING gist(rooms NITH &&) ; 


intarray 扩展 包 的 功能 是 支持 在 整 型 数组 (支持 int4 和 int8) 上 建立 GiST 索引 。intarray 
安装 好 以 后 就 可 以 对 数组 类 型 的 数据 建立 GiST 了 ， 接 着 就 可 以 在 整 型 数组 数据 上 建立 排 
他 性 约束 。 


6.3 索引 


PostgreSQL 的 索引 机 制 功能 强大 、 特 性 丰富 ， 仅 仅 索引 部 分 的 内 容 已 足够 写 一 本 大 部 头 的 
书 。PostgreSQL 原生 支持 若干 种 类 型 的 索引 。 如 果 你 觉得 还 不 够 ，PostgreSQL 还 允许 你 为 
这 几 种 索引 类 型 自 定义 新 的 索引 运算 符 和 修饰 符 以 作为 其 功能 补充 。 如 果 这 样 还 不 能 满足 
你 的 要 求 ， 你 可 以 创建 自己 的 索引 类 型 。 

PostgreSQL 还 支持 在 同一 张 表 中 混合 搭配 不 同 的 索引 类 型 ， 且 预计 规划 器 将 综合 考虑 所 有 
的 索引 。 例 如 ， 在 一 个 字段 上 建立 B- 树 索引 ， 在 旁边 的 字段 上 建立 GiST 索引 ， 查 询 时 两 
个 索引 都 可 以 被 用 上 。 要 更 深入 了 解 规 划 器 对 索引 的 选用 机 制 ， 请 参考 PostgreSQL 官方 手 
册 中 “位 图 索引 扫描 策略 ”一 市 的 内 容 。 


普通 表 和 物化 视图 上 均 可 创建 索引 ， 但 外 部 表 不 行 。 
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同一 schema 内 的 索引 名 不 能 重复 。 








6.3.1 ” PostgreSQL 原生 支持 的 索引 类 型 


要 想 利 用 好 PostgreSQL 的 索引 能 力 ， 需 要 先 了 解 其 支持 的 不 同 的 索引 类 型 以 及 它们 各 自 适 
用 的 场景 。PostgreSQL 原生 支持 的 索引 类 型 包括 以 下 几 种 。 


B- 树 索引 
B- 树 是 一 种 关系 型 数据 库 中 常见 的 通用 索引 类 型 。 如 果 你 对 别 的 索引 类 型 不 感 兴趣 ， 那 
么 一 般 使 用 B- 树 索引 就 可 以 了 。 有 的 场景 下 PostgreSQL 会 自动 创建 索引 (比如 创建 主 
键 约束 或 者 唯一 性 约束 时 )， 那 么 创建 出 来 的 索引 就 是 B- 树 类 型 的 ， 如 果 你 自己 创建 索 
引 时 未 指定 索引 类 型 ， 那 么 默认 也 会 创建 B- 树 类 型 的 索引 。 主 键 约束 和 唯一 性 约束 唯 
一 支持 的 后 台 索 引 就 是 B- 树 索引 。 


BRIN 索引 

BRIN (block range index， 块 范围 索引 ) 是 PostgreSQL 9.4 中 引入 的 一 种 索引 类 型 ， 其 
设计 目的 是 针对 超大 表 做 索引 ， 在 这 种 表 上 创建 B- 树 索引 耗费 的 空间 过 大 ， 以 至 于 无 
法 全 部 容纳 在 内 存 中 ， 这 会 导致 内 存 和 磁盘 间 的 索引 数据 块 换 入 换 出 ， 从 而 严重 影响 查 
询 速 度 。BRIN 索引 的 思路 就 是 把 一 个 范围 内 的 数据 页 面 当 作 一 个 单元 来 处 理 ， 这 样 就 
可 以 大 大 压缩 需要 索引 的 目标 单元 数 。BRIN 索引 占用 的 空间 要 比 B- 树 索引 和 其 他 索引 
小 得 多 ， 同 时 建立 起 来 也 更 快 。 但 其 查询 时 的 速度 相对 较 慢 ， 也 不 能 用 于 确保 唯一 主 
键 ， 另 外 还 有 一 些 场景 页 不 适用 该 类 索引 。 


GiST 索 引 
GiST (generalized search tree， 通 用 搜索 树 ) 主要 的 适用 场景 包括 全 文 检索 以 及 空间 数 
据 、 科 学 数据 、 非 结构 化 数据 和 层次 化 数据 的 搜索 。 该 类 索引 不 能 用 于 保障 字段 的 唯 
性 ， 也 就 是 说 建立 了 该 类 型 索引 的 字段 上 可 插入 重复 值 ， 但 如 果 把 该 类 索引 用 于 排他 性 
约束 就 可 以 实现 唯一 性 保障 。 


GiST 是 一 种 有 损 索 引 ， 也 就 是 说 它 不 存储 被 索引 字段 的 值 ， 而 仅仅 存储 字段 值 的 一 个 
取样 ， 这 种 取样 是 失真 的 ， 就 像 把 一 个 盒子 变 成 了 一 个 多 边 形 。 这 就 意味 着 需要 一 个 额 
外 的 查找 步骤 以 获得 真正 记录 的 值 。 
GIN 索引 
GIN (generalized inverted index， 通 用 逆序 索引 ) 主要 适用 于 PostgreSQL 内 置 的 全 文 
搜索 引擎 以 及 二 进 制 json 数据 类 型 。 其 他 一 些 扩 展 包 (比如 hstore 和 pg_trgm) 也 会 使 
用 这 种 索引 。GIN 其 实 是 从 GiST 派 生出 来 的 一 种 索引 类 型 ， 但 它 是 无 损 的 ， 也 就 是 说 
索引 中 会 包含 有 被 索引 字段 的 值 。 如 果 你 需要 查询 的 字段 都 已 被 索引 ， 那 么 只 读 取 索 引 
即 可 获取 查询 结果 ， 这 种 情况 下 GIN 的 查询 速度 是 快 于 GiST 的 。 然 而 ， 由 于 GIN 比 
GiST 在 更 新 操作 时 要 多 出 一 个 字段 值 复 制 动 作 ， 因 此 此 时 GIN 索引 体积 更 大 并 且 更 新 
速度 慢 于 GiST 索引 。 另 外 ，GIN 的 索引 树 内 部 每 一 个 索引 行 的 长 度 是 有 限制 的 ， 所 以 
它 不 能 用 于 对 hstore 文档 或 者 text 等 大 对 象 类 型 进行 索引 。 如 有 果 你 需要 把 一 个 600 页 
的 手册 内 容 存 人 一 张 表 的 某 个 字段 ， 那 么 绝对 不 要 在 该 字段 上 建立 GIN 类 型 的 索引 。 
在 “Waiting for Faster LIKE/ILIKE 符 ” 这 篇 文章 中 有 一 个 关于 GIN 用 法 的 非常 好 的 例子 可 供 
你 参考 。 在 9.3 版 中 ， 用 于 实现 字符 串 模 糊 匹 配 和 相似 度 查 询 的 pg_trgn 扩展 包 中 做 了 一 个 
功能 强化 : 支持 正则 表达 式 条 件 查询 时 用 上 GIN 索引 ， 这 大 大 增加 了 pg_trgnm 的 适用 场景 。 
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SP-GiST 索引 


SP-GiST 是 指 基于 空间 分 区 树 (space-partitioning trees) 算法 的 GiST 索引 。 该 类 型 的 
索引 与 GiST 索引 的 适用 领域 相同 ， 但 对 于 某 些 特定 领域 的 数据 算法 ， 其 效率 会 更 高 一 
些 。PostgreSQL 的 point 和 box 等 原生 几何 类 型 以 及 text 类 型 是 最 先 支 持 该 类 索引 的 
数据 类 型 。 从 9.3 版 开始 ， 区 间 类 型 也 开始 支持 此 类 型 的 索引 。 








散 列 索引 


散 列 索引 在 GiST 和 GIN 索引 出 现 前 就 已 经 得 到 了 广泛 使 用 。 业 界 普 遍 认为 GiST 和 
GIN 索引 在 性 能 和 事务 安全 性 方面 要 胜 过 散 列 索引 。PostgreSQL 10 之 前 的 版 本 中 ， 事 
务 日 志 中 不 会 记录 散 列 索引 的 变化 ， 那 么 在 流 式 复 制 环境 中 就 不 能 使 用 散 列 索引 ， 否 则 
会 导致 修改 无 法 被 同步 。 尽 管 有 一 段 时 期 散 列 索引 被 PostgreSQL 官方 列 为 不 推荐 使 用 
状态 ， 但 是 在 PostgreSQL 10 中 它 再 次 得 到 了 强化 。 该 版 本 中 ， 散 列 索 引 强化 了 事务 一 
致 性 以 及 一 些 性 能 提升 ， 有 的 场景 中 它 会 比 B- 树 更 快 。 




















基于 B- 树 算法 的 GiST 和 GIN 索引 


如 果 你 想 了 解 PostgreSQL 除了 原生 索引 以 外 还 有 哪些 索引 ， 不 管 是 出 于 业务 需要 还 是 
仅仅 出 于 好 奇 ， 都 可 以 从 了 解 基于 B- 树 算法 的 GiST 和 GIN 索引 开始 。 二 者 都 可 以 用 
扩展 包 形 式 安装 ， 并 且 大 多 数 PostgreSQL 发 行 版 中 都 含有 这 两 个 扩展 包 。 这 两 类 混合 
算法 索引 的 优势 在 于 ， 它 们 既 能 够 支持 GiST 和 GIN 索引 特有 的 运算 符 ， 又 具有 B- 树 
索引 对 于 “等 于 ”运算 符 的 良好 支持 。 当 需要 建立 同时 包含 简单 和 复杂 数据 类 型 的 多 列 
复合 索引 时 ， 你 会 发 现 这 两 类 索引 不 可 或 缺 。 例 如 ， 我 们 建立 的 复合 索引 中 既 有 普通 文 
本 类 型 也 有 full-text 类 型 '。 一 般 来 说 ， 类 似 全 文 检索 、Lltree、geometric 和 空间 类 型 这 
些 高 级 数据 类 型 ， 只 能 使 用 GIN 或 者 GiST 索引 ， 因 此 这 类 字段 不 可 能 与 只 能 建立 B- 树 
索引 的 普通 字段 构成 复合 索引 。 此 时 基于 这 两 种 索引 就 可 以 实现 这 个 目标 ， 基 于 它们 的 
混合 算法 可 以 把 建立 了 GiST 索引 的 字段 和 建立 了 B- 树 索引 的 字段 联合 起 来 ， 组 成 为 单 














一 的 复合 索引 。 


除了 PostgreSQL 原生 附带 的 索引 类 型 外 ， 还 有 一 些 额 外 的 索引 类 型 以 扩展 包 形 式 存 


在 。 其 中 比较 流行 的 是 VODKA 和 RUM (基于 GIN 索引 的 一 个 变种 ) 这 两 种 ， 适 


PostgreSQL 9.6 以 及 之 后 的 版 本 。RUM 索引 适用 于 full-text 之 类 的 复杂 类 型 ， 如 果 
全 文 词组 搜索 ， 那 么 就 必须 使 用 RUM 类 型 。 另 外 ， 它 还 提供 了 一 些 距离 运算 符 。 





适用 于 


你 需要 


另 一 个 索引 类 型 是 pgroonga， 它 以 扩展 包 的 形式 存在 ， 当 前 仅 支 持 PostgreSQL 9.5 和 





PostgreSQL 9.6。 该 扩展 把 作为 全 文 搜索 引擎 同 时 也 是 一 个 列 式 存储 容器 的 roonga 


的 能 力 


带 入 了 PostgreSQL。PGRoonga 扩展 包 中 含有 一 个 名 为 pgroonga 的 索引 类 型 以 及 相应 的 运 





算 符 。PGRoonga 扩展 可 以 实现 对 普通 文本 进行 索引 ， 以 支持 对 其 进行 全 文 检索 ， 


但 不 像 


PostgreSQL 原生 的 全 文 检索 机 制 那样 需要 创建 全 文 检索 向 量 。PGRoonga 还 能 够 实现 让 ILIKE 
和 LIKE '%something%' 这 种 操作 用 上 索引 ， 效 果 类 似 于 pg_trgm 扩展 。 此 外 ， 它 还 支持 对 数 
组 类 型 和 JSONB 类 型 建立 索引 。Linux/Unix 和 Windows 下 该 扩展 都 有 可 用 的 安装 包 。 








注 1，PostgreSQL 没有 full-text 类 型 这 种 说 法 ， 此 处 作者 指 的 是 tsvector 和 tsquery 这 两 种 专 月 
检索 的 数据 类 型 。 译 者 注 








日 于 全 文 








6.3.2 ”运算 符 类 

大 多 数 人 即使 不 知道 “运算 符 类 ”是 什么 以 及 它 与 索引 有 什么 关系 ， 也 能 毫 无 障碍 地 使 用 
索引 。 但 如 果 你 运气 没 这 么 好 ， 也 就 是 说 你 的 应 用 场景 需要 你 了 解 这 些 内 容 ， 那 么 就 得 好 
好 研究 运算 符 类 了 ， 否 则 就 会 一 直 被 这 个 问题 困扰 :“ 为 什么 规划 器 没 用 上 我 的 索引 ? ” 


各 种 数据 类 型 均 有 自身 的 特点 ， 因 此 适用 的 索引 类 型 不 同 ， 会 用 到 的 比较 运算 符 也 不 同 。 
例如 ， 对 于 基于 区 间 类 型 (range) 的 索引 来 说 ， 最 常用 的 运算 符 是 重 盖 运算 符 (&&8)， 然 
而 该 运算 符 对 于 本 文 搜 索 领 域 来 说 却 毫 无 意义 。 对 于 中 文 这 类 表意 文字 来 说 ， 建 立 的 索引 
基本 上 不 会 用 到 “不 等 于 ”运算 符 ， 而 对 英文 这 类 表 音 文字 建立 索引 时 ， 字 母 A 到 乙 的 排 
序 操作 是 不 可 或 缺 的 。 


基于 以 上 特点 ，PostgreSQL 把 一 类 应 用 领域 相近 的 运算 符 以 及 这 些 运算 符 适用 的 数据 类 型 
组 合 在 一 起 ， 称 为 一 个 运算 符 类 。 例 如 ，int4_ops 运算 符 类 包含 适用 于 int4 (也 就 是 日 常 
所 说 的 integer) 类 型 的 = < > > < 运算 符 。PostgreSQL 提供 了 一 张 叫 作 pg_class 的 系统 
表 ， 从 中 可 以 查 到 完整 的 运算 符 类 列表 ， 其 中 既 包 含 了 系统 原生 支持 的 类 ， 也 包含 了 通过 
扩展 包机 制 添 加 的 类 。 一 种 类 型 的 索引 会 使 用 特定 的 若干 种 运算 符 类 。 完 整 的 运算 符 列表 
可 以 从 pgAdmin 界面 上 的 运算 符 类 分 支 下 看 到 ， 也 可 以 根据 system catalog 在 示例 6-12 中 
执行 查询 得 到 。 


示例 6-12 查询 B- 树 索引 支持 的 数据 类 型 以 及 运算 符 类 
SELECT am.amname AS index_method, opc.opcname AS opctLass_name， 
opc.opcintype: :regtype AS indexed_ type, opc.opcdefault AS is default 
FROM pg_am am INNER JOIN pg_opclass opc ON opc.opcmethod = am.oid 
WHERE am.amname = 'btree' 
ORDER BY index_method, indexed_type, opclass_name; 





























index_method | opclass_name | indexed type | is_default 
------------- +---------------------+--------------+------------ 
btree | booL_ops | boolean | 七 
btree | text_ops | text | 七 
btree | text_pattern_ops | text | 千 
btree | varchar_ops | text | 千 
btree | varchar_pattern_ops | text Lf 





在 示例 6-12 中 ， 仅 查询 了 B- 树 的 相关 数据 。 请 注意 ， 每 类 索引 都 会 有 多 个 运算 符 类 ， 而 
其 中 仅 有 一 个 会 被 标记 为 默认 运算 符 类 。 如 有 果 建 立 索 引 时 未 指定 使 用 哪个 运算 符 类 ， 那 么 
PostgreSQL 会 使 用 默认 运算 符 类 。 绝 大 多 数 情况 下 这 么 做 是 没什么 问题 的 ， 但 并 非 绝对 如 此 。 


例如 ，B- 树 索引 默认 的 text_ops 运算 符 类 (又 名 varchar_ops) 中 并 不 支持 ~~ 运算 符 ( 即 
LIKE 运算 符 )， 所 以 如 果 创 建 B- 树 索引 时 选择 了 该 运算 符 类 ， 那 么 所 有 使 用 LIKE 的 查询 都 
无 法 在 text_ops 运算 符 类 中 使 用 索引 。 因 此 ， 如 果 你 的 业务 场景 需要 对 varchar 或 者 text 
类 型 进行 大 量 LIKE 模糊 查询 ， 那 么 创建 索引 时 最 好 显 式 指定 使 用 text_pattern_ops 或 者 
varchar_pattern_ops 这 两 个 运算 符 类 。 指 定 运 算 符 类 的 语法 很 简单 ， 只 需要 在 创建 索引 时 
加 在 被 索引 字段 名 的 后 面 即 可 ， 参 考 示例 如 下 。 


CREATE INDEX idx1 ON census.Lu_tracts USING btree (tract_name text_pattern_ops ) ; 
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在 示例 6-12 的 查询 结果 中 ， 你 可 能 已 经 注意 到 了 B- 树 索引 的 varchar_ops 和 
text_ops 两 种 运算 符 类 适用 的 数据 类 型 都 是 text， 这 样 来 看 的 话 ，varchar_ops 
貌似 有 点 名 不 副 实 。 这 是 因为 varchar 类 型 本 质 上 就 是 加 了 长 度 限制 的 text 
类 型 ， 二 者 可 以 共用 一 套 运 算 符 。varchar_ops 和 varchar_pattern_ops 实质 
上 就 是 text_ops 和 text_pattern_ops 的 别名 ， 之 所 以 把 前 面 两 种 单列 出 来 是 
因为 varchar 毕竟 是 单独 的 一 种 数据 类 型 ， 存 在 一 种 以 其 类 型 命名 的 专属 运 
算 符 类 看 起 来 会 比较 合理 。 





























最 后 请 牢记 这 一 条 : 你 创建 的 每 一 个 索引 都 只 会 使 用 一 个 运算 符 类 。 如 果 希 望 一 个 字段 上 
的 索引 使 用 多 个 运算 符 类 ， 那 么 请 创建 多 个 索引 。 要 将 默认 索引 text_ops 添加 到 表 中 ， 请 
运行 以 下 代码 : 

CREATE INDEX idx2 ON census.Lu_tracts USING btree (tract_name); 
现在 ， 在 同一 个 字段 上 就 有 了 多 个 索引 (单个 字段 上 可 建立 的 索引 个 数 是 没有 限制 的 )。 
规划 器 处 理 等 值 查询 时 会 使 用 idx2， 处 理 Like 模糊 查询 时 会 使 用 idx1。 
你 可 以 在 PostgreSQL 官方 手册 中 找到 关于 运算 符 类 的 更 详细 的 描述 。 另 外 ， 我 们 也 强烈 建 
议 你 阅读 一 下 我 们 的 博客 文章 “Why is My Index Not Used?”。 


6.3.3 ”函数 索引 


PostgreSQL 的 函数 索引 功能 可 以 基于 字段 值 的 函数 运算 结果 建立 索引 。 函 数 索 引 的 用 途 也 
是 很 广泛 的 ， 例 如 可 用 于 对 大 小 写 混 杂 的 文本 数据 建立 索引 。PostgreSQL 是 一 个 区 分 大 小 
写 的 数据 库 ， 如 果 要 实现 不 区 分 大 小 写 的 查询 ， 可 以 借助 如 下 的 函数 索引 : 


CREATE INDEX idx ON featnames_short 
USING btree (upper(fullname) varchar_pattern_ops); 


在 下 面 的 查询 语句 中 ， 我 们 使 用 了 前 面 建立 索引 时 使 用 的 upper 国 数 来 将 fuLLname 字段 变 
为 大 写 后 ， 再 进行 条 件 比较 。 由 于 查询 语句 中 使 用 的 函数 与 我 们 在 建立 索引 时 使 用 的 函数 
相同 ， 因 此 规划 器 会 对 此 查询 语句 使 用 索引 : 


SELECT fullname FROM featnames_short WHERE upper(fullname) LIKE 'S%'; 















































注意 ， 查 询 语句 中 使 用 的 函数 要 与 建立 函数 索引 时 使 用 的 函数 完全 一 致 ， 这 
样 才能 保证 用 上 索引 。 





6.3.4 ”基于 部 分 记录 的 索引 


基于 部 分 记录 的 索引 〈 有 时 也 称 为 已 算 选 索引 ) 是 一 种 仅 针对 表 中 部 分 记录 的 索引 ， 而 且 
这 部 分 记录 需要 满足 WHERE 语句 设置 的 筛选 条 件 。 例 如 ,假设 某 表 中 有 1 000 000 条 记录 ， 
但 你 只 会 查询 其 中 一 个 记录 数 为 10 000 的 子 集 ， 那 么 该 场景 就 非常 适合 使 用 基于 部 分 记 
录 的 索引 。 这 种 索引 比 全 量 索 引 快 ， 因 为 其 体积 小 ， 所 以 可 以 把 更 多 索引 数据 缓存 到 内 存 

















138 | 第 6 章 


中 。 另 外 ， 该 类 索引 占用 的 磁盘 空间 也 更 小 。 


基于 部 分 记录 的 索引 能 够 实现 仅 针 对 部 分 记录 的 唯一 性 约束 。 举 个 例子 ， 假 设 你 手 上 有 一 
家 报纸 在 过 去 10 年 间 的 订阅 用 户 数据 ， 现 在 需要 确保 还 在 订阅 的 用 户 不 会 每 天 多 拿 一 份 
报纸 。 由 于 人 们 对 纸 媒 的 兴趣 下 降 ， 因 此 这 10 年 间 的 全 量 订 阅 用 户 中 仅 有 5% 还 在 坚持 订 
阅 。 所 以 ， 很 显然 你 不 需要 关注 那些 已 经 退 订 的 用 户 ， 因 为 他 们 的 姓名 早已 从 报纸 递送 员 
手 上 的 递送 名 单 中 剔除 。 表 结构 如 下 : 
CREATE TABLE subscribers ( 
id serial PRIMARY KEY ， 


name varchar(50) NOT NULL, type varchar(50), 
is_active boolean); 


我 们 建立 一 个 基于 当前 活跃 用 户 的 部 分 记录 索引 即 可 : 


CREATE UNIQUE INDEX uq ON subscribers USING btree(Lower(name)) WHERE is_active; 






































索引 的 WHERE 条 件 中 使 用 的 函数 必须 是 确定 性 函数 ， 即 固定 的 输入 一 定 能 够 
得 到 固定 输出 的 函数 。 这 意味 着 有 儿 类 函数 是 不 能 用 作 筛选 条 件 的 : 一 类 是 
CURRENT_DATE 这 种 输出 结果 不 停 在 变 的 函数 ， 一 类 是 依赖 于 其 他 表 数 据 进行 
运算 的 函数 ， 其 输出 结果 受 其 他 表 的 数据 的 影响 ， 因 此 输出 也 是 不 固定 的 ， 
还 有 一 类 是 依赖 当前 表 中 的 其 他 记录 行进 行 运算 的 函数 ， 其 输出 也 不 会 受 控 。 
























































需要 特别 强调 的 一 点 是 ， 当 使 用 SELECT 语句 查询 数据 时 ， 要 想 规 划 器 用 上 部 分 记录 索引 ， 
那么 该 查询 语句 的 WHERE 条 件 中 必须 包含 创建 部 分 记录 索引 时 所 使 用 的 WHERE 条 件 ， 如 果 该 
索引 同时 还 是 个 函数 索引 ， 那 么 该 查询 语句 的 WHERE 条 件 中 必须 包含 建立 索引 时 所 使 用 的 函 
数 。 前 面 例子 中 创建 的 部 分 数据 索引 同时 也 是 个 函数 索引 ， 因 为 条 件 中 使 用 了 Lower 函数 而 
不 是 仅 使 用 了 name 字段 。 这 个 逻辑 实际 操作 起 来 比较 麻烦 也 容易 出 错 ， 有 一 个 办 法 可 以 让 
事情 变 得 简单 一 些 ， 那 就 是 建立 一 个 视图 ， 视 图 条 件 就 是 建立 索引 的 条 件 ， 那 么 针对 此 视图 
进行 查询 就 永远 不 会 漏 掉 条 件 了 。 还 是 以 前 述 报纸 订阅 用 户 数据 为 例 ， 建 立 如 下 视图 : 

CREATE OR REPLACE VIEW vw_subscribers_current AS 

SELECT id, lower(name) As name FROM subscribers WHERE is_active = true; 


然后 将 针对 原 表 的 查询 都 改 为 针对 此 视图 的 查询 即 可 (一 种 比较 激进 的 观点 认为 ， 此 种 情 
况 下 永远 都 不 应 该 直接 查询 原 表 )。 视 图 的 本 质 就 是 一 个 保存 下 来 的 查询 语句 ， 创 建 视图 
时 所 用 的 wHERE 条 件 以 及 其 中 的 函数 条 件 部 分 都 会 被 完整 代入 到 任何 针对 该 视图 的 查询 语 
句 中 。 当 然 查 询 视 图 的 语句 也 可 以 包含 额外 的 查询 条 件 ， 这 些 过 滤 条 件 最 后 都 会 生效 。 针 
对 前 面 我 们 刚刚 创建 的 视图 来 说 ， 查 询 视图 的 语句 通过 两 个 代入 步骤 后 即 可 被 翻译 为 针对 
基 表 的 查询 语句 ， 之 后 就 可 以 用 上 基础 表 的 部 分 数据 索引 。 这 两 个 步骤 分 别 为 : 首先 把 查 
询 语句 中 的 name 字段 映射 到 基础 表 的 lower(name)， 这样 查询 视图 的 name 字段 就 等 同 于 查 
询 视图 基础 表 的 lower(name); 然后 把 创建 视图 时 的 is_active=true 条 件 添加 到 原始 的 视 
图 查询 语句 中 。 这 样 代入 后 的 语句 就 可 以 用 上 基础 表 的 部 分 数据 索引 了 : 


SELECT * FROM vw_subscribers_current WHERE name = 'sandy'; 


你 可 以 查看 规划 器 输出 的 执行 计划 以 确认 你 的 索引 是 否 被 用 上 了 。 
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6.3.5 ”多 列 索 引 
在 本 章 前 面 的 内 容 中 , 你 应 该 已 经 见 到 了 大 量 多 列 索 引 (也 称 为 复合 索引 ?) 的 例子 。 请 注 
意 ， 也 可 以 基于 多 个 字段 来 创建 函数 索引 。 以 下 是 一 个 多 列 索 引 的 示例 。 


CREATE INDEX idx ON subscribers 
USING btree (type, upper(name) varchar_pattern_ops); 


PostgreSQL 的 规划 器 在 语句 执行 过 程 中 会 自动 使 用 一 种 被 称 为 “位 图 索引 扫描 ”的 策略 来 
同时 使 用 多 个 索引 。 该 策略 可 以 使 得 多 个 单列 索引 同时 发 挥 作用 ， 达 到 的 效果 与 使 用 单个 
复合 索引 相同 。 如 有 果 你 不 能 确定 业务 的 应 用 模式 是 以 单列 作为 查询 条 件 的 场景 多 一 些 ， 还 
是 同时 以 多 列 作为 查询 条 件 的 场景 多 一 些 ， 那 么 最 好 针对 可 能 作为 查询 条 件 的 每 个 列 单独 
建立 索引 ， 这 是 最 灵活 的 做 法 ， 规 划 器 会 决定 如 何 组 合 使 用 这 些 索 引 。 


假设 你 建 了 一 个 B- 树 多 列 索 引 ， 其 中 包含 type 和 upper(name) 两 个 字段 ， 那 么 完全 没 必 要 
针对 type 字段 再 单独 建立 一 个 索引 ， 因 为 规划 器 即使 在 遇 到 只 有 type 单字 段 的 查询 条 件 
时 ， 也 会 自动 使 用 该 多 列 索 引 ， 这 是 规划 器 的 一 项 基本 能 力 。 如 果 查 询 条 件 字段 没有 从 多 
列 索引 中 的 第 一 个 字段 开始 匹配 ， 规 划 器 其 实 也 能 用 上 索引 ， 但 请 尽量 避免 这 种 情况 ， 因 
为 从 索引 原理 上 说 ， 从 索引 的 第 一 个 字段 开始 匹配 才 是 最 高 效 的 。 


规划 器 支持 一 种 仅 依赖 索引 内 数据 的 查询 策略 (index-only scan) ， 也 就 是 说 如 果 查 询 的 目 
标 字 段 在 索引 内 都 有 ， 那 么 直接 扫描 索引 就 可 以 得 到 查询 结果 ， 根 本 不 需要 访问 表 的 本 体 
了 。 这 个 功能 的 引入 使 得 复合 索引 的 作用 更 为 凸显 ， 因 为 复合 索引 可 以 提供 更 多 数据 ， 因 此 
更 适合 使 用 此 种 查询 方法 。 如 果 你 的 业务 场景 中 查询 的 目标 字段 和 条 件 字段 是 相同 的 那儿 
个 ， 那 么 就 应 该 建立 复合 索引 以 提升 查询 速度 。 不 过 ， 索 引 中 包含 的 字段 越 多 也 就 意味 着 索 
引 占 用 的 空间 会 越 大 ， 能 在 内 存 中 缓存 的 索引 条 目 就 越 少 ， 因 此 请 不 要 滥用 复合 索引 。 







































































注 2: 复合 索引 的 多 个 字段 中 也 可 以 包含 函数 ， 此 时 建立 的 索引 既是 复合 索引 也 是 函数 索引 。 一 一 译 者 注 








140 | 第 6 章 


第 7 章 


PostgreSQL 的 特色 SQL 语法 





PostgreSQL 在 对 ANSI SQL 标准 的 遵从 方面 已 经 远 远 走 在 了 其 他 数据 库 的 前 面 。 除 了 适 配 
标准 之 外 ，PostgreSQL 还 提供 了 类 型 多 样 的 强化 语法 ， 这 些 强化 包括 易 用 的 简化 语法 以 及 
一 些 前 卫 到 足以 打破 关系 型 SQL 边界 的 语法 特性 。 通 过 这 些 努 力 ，PostgreSQL 保持 了 领 
先 地 位 。 本 章 将 介绍 一 些 其 他 数据 库 中 很 少见 的 SQL 语法 特性 。 和 希望 你 已 有 一 定 的 SQL 
开发 经 验 ， 否 则 可 能 无 法 理解 PostgreSQL 为 简化 SQL 开发 工作 所 做 的 努力 。 


7.1 视图 

一 个 设计 良好 的 关系 型 数据 库 中 的 表 存储 的 是 规范 化 的 数据 ， 因 此 当 需 要 从 多 张 表 中 获取 数 
据 时 ， 就 需要 写 关 联 查 询 的 SQL 语句 。 如 果 你 的 应 用 场景 需要 反复 执行 这 种 关联 查询 语句 ， 
可 以 考虑 创建 一 个 视图 。 简 单 来 说 ， 视 图 就 是 持久 化 存储 在 数据 库 中 的 一 个 查询 语句 。 

有 人 认为 用 户 不 应 该 直接 访问 表 ， 而 应 该 通过 视图 来 访问 ， 不 过 这 就 意味 着 需要 为 每 张 表 
都 创建 一 个 视图 。 这 种 做 法 的 优点 是 在 表 的 本 体 之 上 增加 了 一 个 访问 层 ， 简 化 了 权限 管理 
且 使 得 业务 逻辑 抽象 更 容易 ， 缺 点 就 是 太 麻烦 。 我 们 认为 这 个 观点 是 合理 的 ， 但 事实 上 由 
于 惰性 很 少 有 人 会 这 么 做 。 

PostgreSQL 的 视图 功能 近年 来 有 了 长 足 的 发 展 。9.3 版 中 推出 了 可 自动 更 新 的 视图 。 如 果 
你 的 视图 是 基于 单 表 的 ， 并 且 视 图 字段 中 包含 了 基础 表 的 主键 字段 ， 那 么 就 可 以 直接 对 此 
视图 执行 UPDATE 操作 ， 视 图 的 基础 表 数 据 将 随 之 更 新 。 

9.3 版 中 还 引入 了 物化 视图 。 每 个 视图 都 对 应 一 个 SQL 查询 语句 ， 视 图 本 质 上 就 是 该 SQL 
的 查询 结果 集 的 一 个 别名 。 每 次 访问 视图 时 都 需要 执行 其 对 应 的 SQL， 但 物化 视图 将 视图 
逻辑 映射 后 的 数据 记录 实际 存储 下 来 ， 这 样 访问 物化 视图 时 就 省 略 了 视图 底层 SQL 的 执行 
过 程 ， 就 像 访问 一 张 本 地 表 一 样 。 一 旦 物化 视图 建立 好 以 后 ， 只 有 对 它 执行 REFRESH 操作 
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时 才 会 再 次 从 基础 表 中 读 取 数据 。 根 据 前 面 的 描述 可 以 知道 ， 使 用 物化 视图 可 以 节省 计算 
资源 ， 因 为 视图 底层 SQL (这 种 SQL 逻辑 可 能 极其 复杂 ) 不 用 反复 执行 。 但 物化 视图 也 
有 缺点， 因为 如 果 刷 新 不 及 时 ， 就 会 导致 取出 的 数据 可 能 不 是 最 新 的 ， 还 有 一 个 问题 就 是 
物化 视图 刷新 期 间 会 不 可 访问 。 


9.4 版 开始 支持 用 户 在 物化 视图 刷新 时 也 能 对 其 进行 访问 ， 该 版 本 还 引入 了 WITH CHECK 
OPTION 修饰 符 ， 用 于 防止 在 视图 的 范围 之 外 进行 插入 和 更 新 。 


7.1.1 单 表 视图 
最 简单 的 视图 是 从 单个 表 得 出 的 。 如 果 打 算 将 数据 写 回 到 该 表 ， 请 始终 包含 主键 ， 如 示例 
7-1 所 示 。 

示例 7-1 创建 基于 单 表 的 视图 


CREATE OR _ REPLACE VIEW census.vw_facts 2011 AS 
SELECT fact_type_id, val, yr, tract_id FROM census.facts WHERE yr = 2011; 


自从 9.3 版 起 ， 就 可 以 使 用 INSERT、UPDATE 和 DELETE 命令 在 该 视图 中 更 改 数据 了 。 更 新 和 
删除 命令 将 遵从 作为 视图 一 部 分 的 任何 WHERE 条 件 。 例 如 ， 下 面 的 删除 命令 将 仅 删 除 val 
字段 值 为 0 的 记录 : 


DELETE FROM census.vw_facts 2011 WHERE val = 0; 


以 下 UPDATE 操作 不 会 更 新 任何 记录 ， 因 为 视图 仅 包含 2011 年 的 数据 : 


UPDATE census.vw_facts_2011 SET val = 1 WHERE yr = 2012; 
请 注意 ， 针 对 视图 插入 的 数据 可 能 不 会 被 包含 在 视图 可 见 范 围 内 ， 针 对 视图 的 更 新 操作 也 
会 发 生 类 似 现 象 ， 即 更 新 后 的 数据 不 再 被 包含 在 视图 的 可 见 范 围 内 ， 如 示例 7-2 所 示 。 
示例 7-2 针对 视图 进行 UPDATE 操作 ， 修 改 后 的 数据 不 再 落 在 视图 可 见 范围 内 


UPDATE census.vw_facts_2011 SET yr = 2012 WHERE yr = 2011; 


示例 7-2 中 的 UPDATE 语句 操作 的 目标 记录 是 落 在 视图 可 见 范围 内 的 ， 但 更 新 后 会 把 本 来 
落 在 视图 可 见 范围 内 的 记录 变 成 落 到 视图 可 见 范围 之 外 ， 也 就 是 说 视图 更 新 后 少 了 一 条 记 
录 。 但 为 了 保持 视图 数据 的 一 致 性 ， 我 们 不 希望 这 种 情况 发 生 ， 也 就 是 说 希望 更 新 后 的 数 
据 仍然 应 该 落 在 视图 可 见 范围 内 ， 因 此 任何 会 导致 这 种 情况 发 生 的 插入 或 者 更 新 操作 都 应 
被 禁止 。 这 可 以 通过 9.4 版 中 引入 的 WITH CHECK OPTION 子 句 来 实现 。 创 建 视 图 时 如 果 附 带 
了 此 子 句 ， 那 么 此 视图 中 插入 的 数据 或 者 更 新 后 的 数据 落 在 视图 可 见 范 围 之 外 时 ， 系 统 会 
报错 ， 违 反 了 该 约束 的 操作 会 失败 。 下 面 我 们 将 限定 vs_facts_2011 视图 仅 允 许 插 入 2011 
年 的 数据 ， 同 时 不 允许 将 yr 字段 修改 为 2011 以 外 的 其 他 值 。 我 们 修改 一 下 视图 定义 ， 把 
这 个 约束 加 上 ,语法 如 示例 7-3 所 示 。 

示例 7-3 创建 带 有 WITH CHECK OPTION 约束 的 单 表 视图 

CREATE OR _ REPLACE VIEW census.vw_facts_2011 AS 


SELECT fact_type_id, val, yr, tract_id FROM census.facts 
WHERE yr = 2011 WITH CHECK OPTION; 


尝试 执行 以 下 更 新 操作 : 
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UPDATE census.vw_facts 2011 SET yr = 2012 WHERE val > 2942; 
你 会 看 到 这 样 的 报错 信息 : 


ERROR: new row violates WITH CHECK OPTION for view"vw_facts_2011" 
DETAIL: Failing row contains (1, 25001010500, 2012, 2985.000, 100.00). 


7.1.2 ”使 用 触发 器 来 更 新 视图 


视图 可 以 将 针对 多 张 表 的 关联 查询 封装 为 针对 视图 的 简单 查询 。 如 果 视 图 的 基础 表 有 多 
张 ， 那么 直接 更 新 该 视图 是 不 允许 的 ， 因 为 多 张 表 必然 带 来 的 问题 就 是 操作 要 落 到 哪个 基 
础 表 上 ，PostgreSQL 是 无 法 自动 判定 的 。 假 设 你 有 一 个 视图 ， 该 视图 基于 一 张 国 家 信息 表 
和 一 张 省 份 信 息 表 ， 此 时 你 希望 删除 该 视图 的 一 条 记录 ，PostgreSQL 无 法 得 知 你 到 底 想 要 
仅 删除 一 条 国家 记录 ， 还 是 仅 删除 一 个 省 份 记录 ， 抑 或 是 删除 一 个 国家 以 及 该 国家 对 应 的 
所 有 省 的 记录 。PostgreSQL 无 法 自动 判定 你 想 做 什么 并 不 代表 就 不 能 对 这 种 复杂 视图 进行 
修改 操作 ， 你 可 以 通过 编写 触发 器 来 对 这 些 操作 进行 转 义 处 理 ， 转 义 后 的 逻辑 中 可 以 体现 
你 的 意图 。 


我 们 首先 建立 一 个 关联 了 两 张 表 的 视图 ， 如 示例 7-4 所 示 。 


示例 7-4 创建 vw_facts 视图 
CREATE OR REPLACE VIEW census.vw_facts AS 
SELECT 






















































































y.fact_ type_id, y.category, y.fact_subcats, y.short_name, 
x.tract_id, x.yr, x.val, x.perc 

FROM census.facts As x INNER JOIN census.lu fact types As y 

ON x.fact_ type_ id = y.fact type_id; 


要 实现 通过 触发 器 来 更 新 视图 这 一 目标 ， 需 要 定义 一 个 或 者 多 个 INSTEAD OF 触发 器 来 实现 
针对 INSERT、UPDATE、DELETE 这 三 大 基本 操作 的 转 义 处 理 。 值 得 一 提 的 是 ，PostgreSQL 支 
持 基 于 TRUNCATE 事件 的 触发 器 。 触 发 器 需要 有 一 个 基础 国 数 ， 你 可 以 使 用 除 SQL 外 的 任 
何 语言 来 编写 该 基础 函数 ， 其 命名 也 没有 规则 限制 。 我 们 在 示例 7-5 中 选择 使 用 PL/pgSQL 
语法 来 编写 。 


示例 7-5 在 ww_facts 视图 上 创建 一 个 对 INSERT、UPDATE、DELETE 操作 进行 转 义 处 理 的 函数 
CREATE OR REPLACE FUNCTION census.trig vw_facts_ins_upd_del() RETURNS trigger AS 
$$ 
BEGIN 
IF (TG_OP = 'DELETE') THEN @ 
DELETE FROM census.facts ASf 
WHERE 
f.tract_id = 0LD.tract id AND f.yr = OLD.yr AND 
f.fact_ type_id = OLD.fact type_id; 
RETURN OLD; 
END IF; 
IF (TG_OP = 'INSERT') THEN @ 
INSERT INTO census.facts(tract id, yr, fact type_id, val, perc) 
SELECT NEW.tract_id, NEW.yr, NEW.fact_type_id, NEW.val, NEW.perc; 
RETURN NEW; 
END IF; 























PostgreSQL 的 特色 SQL 语法 | 143 


IF (TG_OP = 'UPDATE' ) THEN © 


IF 
ROW(OLD.fact_type_id, OLD.tract id, OLD.yr, OLD.val, OLD.perc) != 
ROW(NEW. fact_type_id, NEW.tract_id, NEW.yr, NEW.val, NEW.perc) 
THEN @ 
UPDATE census.facts AS f 
SET 
tract_id = NEW.tract_id, 
yr = NEW.yr, 
fact_type_id = NEW.fact_type_id, 
val = NEW.val, 
perc = NEN.perc 
WHERE 
f.tract_id = OLD.tract_id AND 
f.yr = OLD.yr AND 
f.fact_ type_id = OLD.fact type_id; 
RETURN NEW; 
ELSE 
RETURN NULL; 
END IF; 
END IF; 
END; 
$$ 


LANGUAGE plpgsql VOLAT 


ILE; 











@ 对 删除 操作 进行 转 义 处 到 


， 筛 选 条 件 的 字段 取 值 来 源 于 0LD 记录 。! 

















@ 对 插入 操作 进行 转 义 处 到 





IT 


o 











EE。 根据 0LD 记录 的 内 容 判 断 哪些 记录 要 更 新 为 NEW 记录 。? 





@ 对 更 新 操作 进行 转 义 处 到 





@ 比较 0LD 记录 和 NEW 记录 的 字段 值 ， 只 有 二 者 不 一 样 时 才 真正 执行 更 新 动作 。 


接 下 来 ， 我 们 将 此 触发 器 函 





数 绑 定 到 视图 上 ， 话 法 如 示例 7-6 所 示 。 











示例 7-6 将 触发 器 函数 绑 定 到 视图 上 
CREATE TRIGGER trig_ 01_vw_facts_ins_uypd_del 
INSTEAD OF INSERT OR UPDATE OR DELETE ON census.vw_facts 
FOR EACH ROW EXECUTE PROCEDURE census.trig vw_facts_ins_upd_del(); 


可 以 看 到 ， 这 个 绑 定 过 程 所 使 用 的 语法 几乎 就 是 一 行 很 自然 的 英文 句子 ， 这 种 情况 在 SQL 


领域 还 是 不 多 见 的 。 








现在 针对 视图 进行 更 新 、 删 除 或 插入 操作 时 ， 这 些 操作 将 更 新 基础 facts 表 : 


UPDATE census.vw_facts SET yr = 2012 
WHERE yr = 2011 AND tract_id = '25027761200'; 


执行 成 功 后 PostgreSQL 会 输出 以 下 信息 : 


Query returned successfully: 56 rows affected, 40 ms execution time. 














注 1: 0LD 记录 是 指 原始 的 针对 视图 的 删除 动作 所 要 删除 的 视图 记录 。 也 就 是 说 ，0LD 记录 是 视图 记录 ， 而 





非 视图 基础 表 的 记录 。 一 一 译 者 注 
注 2: NEW 记录 指 的 是 原始 的 针对 视图 的 更 新 动作 设置 的 修改 后 的 视图 记录 。 也 就 是 说 ，NENW 记录 是 视图 记 
非 视图 基础 表 的 记录 。 一 一 译 者 注 
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如 果 试 图 更 新 的 字段 不 在 前 面 触发 器 函数 中 所 列 的 可 更 新 字段 列表 中 ， 那 么 更 新 操作 就 不 
会 命中 任何 记录 ; 














UPDATE census.vw_facts SET short name = 'test'; 





输出 消息 将 如 下 所 示 : 


Query returned successfully: 0 rows affected, 931 ms execution time. 





前 下 








i 的 例子 中 我 们 用 一 个 触发 器 函数 处 理 了 所 有 类 型 的 触发 事件 (INSERT、UPDATE、 





DELETE) ， 但 实际 上 专门 为 每 种 触发 事件 创建 一 个 独立 的 触发 器 也 是 可 以 的 。 


PostgreSQL 还 支持 一 种 名 为 rules 的 规则 机 制 来 更 新 视图 ， 该 机 制 的 出 现 早 于 INSTEAD OF 
触发 器 支持 视图 这 一 功能 。 博 文 “Database Abstraction with Updateable Views” 中 有 基于 
rules 机 制 实现 可 更 新 视图 的 例子 。 


你 依然 可 以 使 用 rules 机 制 来 实现 视图 数据 的 更 新 ， 但 我 们 更 推荐 使 用 INSTEAD OF 触发 
器 机 制 。 从 内 部 实现 机 制 看 ，PostgreSQL 依然 使 用 了 rules 机 制 来 实现 视图 功能 (视图 本 
质 上 就 是 一 个 INSTEAD OF SELECT 规则 加 上 一 个 虚拟 表 ) 和 基于 单 表 的 可 更 新 视图 功能 。 
rules 机 制 和 触发 器 机 制 的 区 别 在 于 : rules 机 制 通过 重 写 原始 SQL 达成 目标 ， 触 发 器 通过 
拦截 每 行 操作 并 改变 其 实现 逻辑 来 达成 目标 。 可 以 看 到 ， 当 一 个 操作 涉及 多 张 表 时 ，rules 
系统 无 论 是 编写 还 是 理解 起 来 都 比 触发 器 困难 得 多 。rules 机 制 还 有 一 个 缺陷， 就 是 只 能 用 
SQL 语言 编写 ， 其 他 过 程式 语言 都 不 支持 。 


7.1.3 物化 视图 
物化 视图 会 把 视图 可 见 范围 内 的 数据 在 本 地 缓存 下 来 ， 然 后 就 可 以 当成 一 张 本 地 表 来 使 


用 。 































































































首次 创建 物化 视图 以 及 对 其 执行 REFRESH MATERIALIZED VIEW 刷新 操作 时 ， 都 会 触发 数 























据 缓 存 动作 ， 只 不 过 前 者 是 全 量 缓存 ， 后 者 是 增 量 刷新 。 请 注意 ， 物 化 视图 特性 是 从 9.3 
版 开始 支持 的 。 





物化 视图 最 典型 的 应 用 场景 是 用 于 加 速 时 效 性 要 求 不 高 的 长 时 复杂 查询 ， 在 OLAP (在 线 
分 析 与 处 理 ) 领域 ， 这 种 查询 经 常 出 现 。 


物化 视图 的 另 一 个 特点 就 是 支持 建立 索引 以 加 快 查询 速度 。 示 例 7-7 建立 了 示例 7-1 中 的 
视图 的 物化 版 本 。 


示例 7-7 建立 物化 视图 











CREATE MATERIALIZED VIEW census.vw_facts_ 2011 materialized AS 
SELECT fact_type_id, val, yr, tract_id FROM census.facts WHERE yr = 2011; 





然后 对 物化 视图 建立 一 个 索引 ， 语 法 与 在 普通 表 上 建立 索引 完全 相同 ， 如 示例 7-8 所 示 。 
示例 7-8 在 物化 视图 上 建立 索引 

















CREATE UNIQUE INDEX ix 
ON census.vw_facts 2011 materialized (tract id, fact type_id, yr); 








当 物 化 视图 中 含 大 量 记录 时 ， 为 了 加 快 对 它 的 访问 速度 ， 我 们 需要 对 数据 进行 排序 。 要 实 











现 这 一 点 ， 最 简单 的 方法 就 是 在 创建 物化 视图 时 使 用 的 SELECT 语句 中 增加 ORDER BY 子 句 。 
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另外 一 种 方法 就 是 对 其 执行 聚 禾 排 序 操作 ， 以 使 得 记录 的 物理 存储 顺序 与 索引 的 顺序 相 
同 ， 有 具体 步骤 是 : 首先 创建 一 个 索引 ， 该 索引 应 体现 你 所 希望 的 排序 ， 然 后 基于 指定 索引 
对 物化 视图 执行 CLUSTER 命令 ， 语 法 如 示例 7-9 所 示 。 


示例 7-9 ”基于 某 索 引 对 物化 视图 执行 聚 秘 排 序 操作 
CLUSTER census.vw_facts_2011_materialized USING ix; © 
CLUSTER census.vw_facts_2011_materialized; @ 


@ 指定 聚 徐 操 作 所 依据 的 索引 名 。 执 行 过 以 后 ， 系 统 就 会 自动 记 下 该 表 是 依据 哪个 索引 进 
行 聚 徐 排 序 的 ， 后 面 再 次 执行 聚 禾 操 作 时 系统 会 自动 使 用 该 索引 ， 所 以 索引 名 仅 在 首次 
聚 徐 操 作 时 需要 ， 后 续 不 再 需要 。 

@ 每 次 刷新 过 物化 视图 后 ， 都 需要 重新 对 其 进行 一 次 聚 簇 排序 操作 。 

相对 于 CLUSTER 方案 来 说 ，0ORDER BY 方案 的 优点 在 于 ， 每 次 执行 REFRESH MATERIALIZED 

VIEW 时 都 会 自动 对 记录 进行 重 排 序 ， 但 CLUSTER 方案 就 必须 手动 执行 ， 其 缺点 在 于 物化 视 

图 加 了 ORDRE BY 以 后 ，REFRESH 操作 执行 会 耗 时 更 入 。 在 正式 使 用 ORDER BY 方案 之 前 ， 你 

应 该 对 REFRESH 操作 进行 测试 ， 看 其 性 能 是 否 可 接受 。 另 一 种 测试 方法 是 直接 运行 创建 物 

化 视图 时 所 用 的 带 ORDER BY 的 SQL 语句 。 

在 PostgreSQL 9.3 中 ， 刷 新 物化 视图 的 语法 如 下 : 


REFRESH MATERIALIZED VIEW census.vw_facts_2011_materialized; 


在 PostgreSQL 9.4 中 ， 为 了 解决 物化 视图 刷新 操作 时 不 可 访问 的 问题 ， 可 以 使 用 以 下 语法 : 


REFRESH MATERIALIZED VIEW CONCURRENTLY census.vw_facts_2011_materialized; 
物化 视图 有 以 下 几 个 缺点 。 


。 不 支持 通过 CREATE OR REPLACE 语法 来 对 一 个 现 有 的 物化 视图 进行 重建 ， 要 想 重 建 只 
能 先 删 除 再 重建 ， 即 使 只 做 很 小 的 改变 也 需要 这 么 做 。 删 除 语 法 是 DROP MATERIALIZED 
VIEW + 视图 名 。 删 除 以 后 ， 该 视图 上 所 有 的 索引 都 会 丢失 。 

。 每 次 刷新 数据 时 都 要 执行 一 次 REFRESH MATERIALIZED VIEW 操作 。PostgreSQL 不 支持 自 
动 刷 新 物化 视图 。 要 想 实现 自动 刷新 ， 必 须 使 用 类 似 crontab、pgAgent 定时 任务 或 者 
是 触发 器 之 类 的 机 制 。 博 文 “Caching Data-with Materialized Views and Statement-Level- 
Trigger” 中 提供 了 一 个 使 用 触发 器 来 进行 刷新 的 例子 ， 可 供 你 参考 。 

。 在 9.3 版 中 ， 刷 新 物化 视图 是 一 个 阻塞 操作 ;也 就 是 说 ， 视 图 在 刷新 期 间 是 无 法 访问 的 。 
9.4 版 中 引入 了 一 个 新 的 CONCURRENTLY 关键 字 ， 在 REFRESH 命令 中 增加 了 该 关键 字 以 后 ， 
可 以 解除 锁定 限制 ， 前 提 条 件 是 被 刷新 的 物化 视图 上 要 有 一 个 唯一 索引 。 实 现 无 锁 刷 新 
的 代价 就 是 ， 如 果 有 人 在 刷新 期 间 进 行 视图 访问 ， 那 么 刷新 时 间 会 变 长 。 


7.2 ”灵活 易 用 的 PostgreSQL 专 有 SQL 语法 


我 们 在 多 年 编写 SQL 语句 的 过 程 中 使 用 过 很 多 PostgreSQL 专 有 语法 ， 借 助 它们 可 以 编写 
出 更 加 简洁 以 及 功能 更 加 强大 的 SQL。 本 节 介 绍 的 语法 都 是 PostgreSQL 的 专 有 语法 。“ 专 
有 ”意味 着 该 语法 不 符合 ANSI SQL 标准 。 如 有 果 你 的 老板 要 求 你 编写 的 SQL 必须 遵守 
ANSI SQL 标准 ， 那 么 请 不 要 使 用 本 市 介绍 的 专 有 语法 。 
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7.2.1 DISTINCT ON 


我 们 认为 最 好 用 的 一 个 专 有 语法 就 是 DISTINCT ON， 甚 功能 类 似 于 DISTINCT， 但 可 以 精确 
到 更 细 的 粒度 。DISTINCT 会 将 结果 集中 完全 重复 的 记录 剔除 ， 但 DISTINCT ON 可 以 将 结果 
集中 指定 字段 值 的 重复 记录 剔除 ， 具 体 实现 方法 是 先 对 结果 集 按 照 DISTINCT ON 指定 的 字 
段 进行 排序 ， 然 后 算 选 出 每 个 字段 值 第 一 次 出 现时 所 在 的 记录 ， 其 余 的 记录 都 剔除 。 可 以 
看 到 ， 一 个 小 小 的 单词 ON 就 实现 了 必须 写 大 量 代码 才能 实现 的 功能 。 


示例 7-10 中 演示 了 如 何 获 取 马 院 诸 塞 州 每 个 县 的 第 一 个 人 口 统计 区 的 信息 。 


示例 7-10 DISTINCT ON 的 用 法 
SELECT DISTINCT ON (Left(tract id, 5)) 
Left(tract id，5) As county, tract id, tract_name 
FROM census.lu_tracts 
ORDER BY county, tract id; 





























county tract_name 


| | 
+ + 
25001 | 25001010100 | Census Tract 101, Barnstable County, Massachusetts 
| | 
| | 
| | 
| | 


25003 25003900100 | Census Tract 9001, Berkshire County, Massachusetts 
25005 25005600100 | Census Tract 6001, Bristol County, Massachusetts 
25007 25007200100 | Census Tract 2001, Dukes County, Massachusetts 
25009 25009201100 Census Tract 2011, Essex County, Massachusetts 

(14 rows) 


请 注意 ，ON 修饰 符 支 持 设置 多 列 ， 运 算 时 将 基于 这 多 个 列 的 总 体 唯一 性 来 进行 去 重 操 作 。 
同时 ， 查 询 语句 中 ORDER BY 子 句 的 排序 字段 列表 的 最 左 侧 必须 是 DISTINCT ON 指定 的 字段 
列表 ， 即 保证 整个 结果 集 是 按照 这 几 个 字段 排序 的 ， 这 样 最 终 去 重 后 得 到 的 结果 才 是 你 想 
要 的 。 











7.2.2 LIMIT 和 OFFSET 关 键 字 


LIMIT 关键 字 指 定 了 查询 时 仅 返 回 指定 数量 的 记录 ，0OFFSET 关键 字 指 定 了 从 第 几 条 记录 开 
始 返回 。 你 可 以 将 二 者 结合 起 来 使 用 ， 也 可 以 单独 使 用 。 一 般 来 说 ， 这 两 个 关键 字 总 是 和 
ORDER BY 联 用 的 ， 因 为 只 有 在 一 个 已 经 按照 用 户 的 意图 排 好 序 的 结果 集 上 指定 返回 特定 的 
子 结果 集 才 有 意义 。 示 例 7-11 中 演示 了 OFFSET 关键 字 的 用 法 ， 如 果 不 设置 OFFSET 的 话 ， 
其 值 默 认为 0。 


该 语法 并 非 PostgreSQL 所 特有 ， 事 实 上 它 最 早 源 自 于 MySQL。 这 种 限制 返回 结果 记录 数 
的 功能 在 很 多 数据 库 中 都 支持 ， 但 具体 语法 和 内 部 实现 机 制 各 有 千秋 。 


示例 7-11 要 求 示例 7-10 的 查询 结果 集 仅 返 回 从 第 3 条 开始 的 3 条 记录 
SELECT DISTINCT ON (left(tract id, 5)) 
Left(tract id，5) As county, tract_ id, tract_name 
FROM census.lu_tracts 
ORDER BY county, tract _ id LIMIT 3 OFFSET 2; 












































county | tract_id | tract_name 
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i a A 人 2 全 
25005 | 25005600100 | Census Tract 6001, Bristol County, Massachusetts 
25007 | 25007200100 | Census Tract 2001, Dukes County, Massachusetts 
25009 | 25009201100 | Census Tract 2011, Essex County, Massachusetts 
(3 rows) 


7.2.3 简化 的 类 型 转换 语法 

ANSI SQL 标准 中 定义 了 一 个 名 为 CAST 的 类 型 转换 函数 ， 可 以 实现 数据 类 型 之 间 的 互 转 。 例 
如 CAST('2011-1-1' AS date) 可 以 将 文本 2011-1-1 转换 为 一 个 日 期 型 数据 。PostgreSQL 支持 
一 种 简写 语法 ， 该 语法 使 用 了 两 个 冒号 来 表示 转换 关系 ， 具 体格 式 为 : '2011-1-1'::date。 
这 种 写法 形式 更 简洁 也 更 易于 使 用 ， 比 如 有 时 候 需 要 级 联 执行 多 个 类 型 转换 动作 ， 也 就 是 
说 需要 将 类 型 A 转换 为 类 型 B 再 转换 为 类 型 C， 这 种 情况 用 简写 语法 也 是 可 以 实现 的 ， 例 


如 someXML: :text: :integer。 


7.2.4 一 次 性 插入 多 条 记录 


PostgreSQL 支持 一 次 性 插入 多 条 记录 的 语法 。 示 例 7-12 演示 了 如 何 向 示例 6-3 中 创建 的 表 
中 一 次 性 插入 多 条 记录 。 
示例 7-12 一 次 性 插入 多 条 记录 

INSERT INTO logs 2011 (user_name, description, log_ts) 

VALUES 


('robe', 'logged in', '2011-01-10 10:15 AM EST'), 
('lhsu', 'logged out', '2011-01-11 10:20 AM EST'); 


请 注意 ， 在 PostgreSQL 中 VALUES 子 句 并 不 是 只 能 作为 INSERT 语句 的 一 部 分 来 使 用 ， 它 其 
实 是 一 个 动态 生成 的 临时 结果 集 ， 可 用 于 多 种 场合 ， 如 示例 7-13 所 示 。 
示例 7-13 ”使 用 VALUES 语法 来 模拟 一 个 虚拟 表 
SELECT * 
FROM ( 
VALUES 
('robe', 'logged in', '2011-01-10 10:15 AM EST' : :titmestamptz ) ， 
('lhsu', 'logged out', '2011-01-11 10:20 AM EST'::timestamptz) 
) AS L (user_name, description, log_ts); 


将 VALUES 子 句 当 作 一 个 虚拟 表 来 用 时 ， 需 要 为 该 表 指 定 字段 名 ， 并 对 那些 无 法 隐 式 转换 的 
字段 值 显 式 地 进行 类 型 转换 。MySQL 和 SQL Server 也 支持 该 语法 。 


7.2.5 ”使 用 ILIKE 实 现 不 区 分 大 小 写 的 查询 

PostgreSQL 是 一 套 区 分 大 小 写 的 系统 ， 但 它 也 可 以 实现 不 区 分 大 小 写 的 文本 搜索 ， 实 现 方 
法 有 两 种 。 一 种 是 将 ANSI LIKE 运算 符 两 边 的 文本 都 用 upper 国 数 转 为 大 写 ， 但 这 样 会 导 
致 用 不 上 索引 ， 或 者 必须 单独 建立 一 个 基于 upper 函数 的 函数 式 索 引 才 能 使 查询 语句 用 上 
索引 。 另 一 种 是 使 用 PostgreSQL 所 特有 的 ILIKE 运算 符 (~~*) ， 语 法 如 下 : 


SELECT tract_name FROM census.Lu_tracts WHERE tract_name ILIKE '%duke%'; 
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tract_name 


Census Tract 2001, Dukes County, Massachusetts 
Census Tract 2002, Dukes County, Massachusetts 
Census Tract 2003, Dukes County, Massachusetts 
Census Tract 2004, Dukes County, Massachusetts 
Census Tract 9900, Dukes County, Massachusetts 


7.2.6 ”使 用 ANY 运 算 符 进行 数组 搜索 

PostgreSQL 有 一 个 专用 于 数组 数据 处 理 的 ANY 运算 符 ， 一 般 用 于 单个 值 与 数组 元 素 值 的 匹 
配 比 较 场景 ， 所 以 使 用 时 还 会 需要 有 一 个 比较 运算 符 或 者 比较 关键 字 。ANY 运算 符 的 效果 
是 ， 只 要 数组 中 的 任何 元 素 与 该 行 被 比较 的 字段 值 匹配 ， 则 该 行 记录 就 被 查询 条 件 命 中 。 
以 下 是 一 个 例子 : 


SELECT tract_name 
FROM census.lu_tracts 
WHERE tract_name ILIKE ANY(ARRAY[ '%99%duke%','%06%Barnstable%']::text[]); 















































tract_name 


Census Tract 102.06, Barnstable County, Massachusetts 
Census Tract 103.06, Barnstable County, Massachusetts 
Census Tract 106, Barnstable County, Massachusetts 
Census Tract 9900, Dukes County, Massachusetts 

(4 rows) 


可 以 把 这 个 例子 里 面 的 数组 元 素 全 部 拆 出 来 ， 每 个 写成 一 行 ILIKE 比较 语句 并 用 oOR 将 这 些 
语句 连 起 来 ， 这 也 可 以 达到 与 上 例 同 等 的 效果 ， 但 显然 要 繁琐 得 多 。 也 可 以 将 ANY 运算 符 
与 LIKE、=、~ (基于 正则 表达 式 的 tlike 运算 ) 等 比较 运算 符 联 用 。 
ANY 运算 符 是 非常 通用 的 ， 它 可 以 针对 任何 数据 类 型 的 数组 使 用 ， 可 以 与 任何 比较 运算 符 
联 用 〈 所 谓 比较 运算 符 就 是 指 返回 结果 类 型 为 布尔 型 的 运算 符 ) ， 甚 至 可 以 与 用 户 自 定义 
的 或 者 是 安装 扩展 包 得 到 的 新 数据 类 型 或 者 新 比较 运算 符 联 用 。 


7.2.7 ”可 以 返回 结果 集 的 函数 
所 谓 返 回 结 果 集 的 函数 就 是 能 够 一 次 性 返回 多 行 记 录 的 函数 。 
PostgreSQL 允许 在 SELECT 语句 中 调用 能 够 返回 多 行 记录 的 函数 。 其 他 大 多 数 数据 库 都 不 
支持 该 功能 ， 一 般 仅 支 持 调 用 返回 一 行 记录 的 函数 。 
在 一 个 复杂 的 SQL 语句 中 使 用 返回 结果 集 的 函数 很 容易 导致 意外 的 结果 ， 这 是 因为 这 类 
国 数 输出 的 结果 集会 与 该 语句 其 他 部 分 生成 的 结果 集 产生 笛 卡 儿 积 ， 从 而 生成 更 多 的 记 
录 行 。 因 此 在 使 用 之 前 ， 你 必须 对 此 后 果 有 所 了 解 。 在 示例 7-14 中 ， 我 们 使 用 generate_ 
series 图 数 演 示 了 这 种 情况 。 先 建 表 如 下 ; 

CREATE TABLE ;intervaL_pertiods (i type interval); 


INSERT INTO interval_periods (i_type) 
VALUES ('5 months'), ('132 days'), ('4862 hours'); 
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示例 7-14 在 SELECT 语句 中 使 用 返回 结果 集 的 函数 
SELECT i_type, 
generate_series('2012-01-01'::date,'2012-12-31'::date,i type) As dt 
FROM interval_periods; 


| 
4 
5 months | 2012-01-01 00:00:00-05 
5 months | 2012-06-01 00:00:00-04 

| 

| 

| 

| 


5 months 2012-11-01 00:00:00-04 
132 days 2012-01-01 00:00:00-05 
132 days 2012-05-12 00:00:00-04 
132 days 2012-09-21 00:00:00-04 


4862 hours | 2012-01-01 00:00:00-05 
4862 hours | 2012-07-21 15:00:00-04 


7.2.8 ”限制 对 继承 表 的 DELETE、UPDATE、INSERT 操 作 的 影响 
范围 
如 果 表 间 是 继承 关系 ， 那 么 查询 父 表 时 就 会 将 子 表 中 满足 条 件 的 记录 也 查 出 来 。DELETE 和 
UPDATE 操作 也 遵循 类 似 人 逻辑 ， 即 对 父 表 的 修改 操作 也 会 影响 到 子 表 的 记录 。 有 时 你 可 能 希 
望 操作 仅 限定 于 主 表 范围 之 内 ， 并 不 希望 子 表 受 到 波及 。 
PostgreSQL 提供 了 ONLY 关键 字 以 实现 此 功能 。 我 们 在 示例 7-37 中 展示 了 oNLY 的 用 法 。 在 
该 示例 中 ， 我 们 希望 仅 从 生产 表 中 删除 那些 尚未 迁移 到 日 志 表 中 的 记录 。 如 果 没 有 ONLY 修 
饰 符 ， 我 们 最 终 将 从 子 表 中 删除 先前 可 能 已 移动 过 的 记录 。 





























7.2.9 DELETE USING 语 法 


我 们 经 常会 遇 到 “只 有 当 记 录 的 字段 值 落 在 另外 一 个 结果 集中 时 ， 才 需要 删除 该 记录 ”的 
情况 ， 那 么 此 时 就 必须 借助 一 次 关联 查询 才能 定位 到 要 删除 的 目标 记录 。 此 时 可 以 使 用 
USING 子 句 来 指定 需 关 联 的 表 ， 然 后 在 WHERE 子 句 中 编写 USING 子 句 的 表 和 FROM 子 句 的 
表 之 间 的 关联 语句 ， 来 确定 哪些 记录 需 删 除 。USING 子 句 中 可 以 指定 多 张 表 ， 中 间 用 逗号 
分 隔 。 在 示例 7-15 中 ， 我 们 借助 一 个 关联 查询 实现 了 删除 census.facts 表 中 符合 short_ 
nane='s91' 这 个 条 件 的 记录 。 

示例 7-15 ”DELETE USING 的 用 法 

DELETE FROM census .facts 


USING census.Lu_fact_types As ft 
WHERE facts.fact type_id = ft.fact type_id AND ft.short_name = 's01'; 


如 有 果 不 使 用 该 语法 ， 一 般 的 做 法 是 在 WHERE 子 句 中 使 用 笨拙 的 IN 表达 式 。 


7.2.10 将 修改 影响 到 的 记录 行 返回 给 用 户 


RETURNING 是 ANSI SQL 规定 的 标准 语法 ， 但 支持 该 语法 的 数据 库 却 不 多 。 在 示例 7-37 中 ， 
我 们 通过 RETURNING 子 句 将 在 DELETE 操作 中 被 删除 的 记录 返回 给 了 用 户 。 当 然 ，INSERT 和 
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UPDATE 操作 也 是 可 以 使 用 RETURNING 的 。 对 于 带 serial 类 型 字段 的 表 来 说 ，RETURNING 语 
法 是 很 有 用 的 ， 因 为 向 这 类 表 中 播 入 记录 时 ，serial 字段 是 临时 生成 而 非 用 户 指定 的 ; 也 
就 是 说 在 插入 动作 完成 之 前 ， 用 户 也 不 知道 serial 字段 的 值 会 是 多 少 ， 除 非 是 再 查询 一 
遍 。 而 RETURNING 语法 使 得 用 户 不 用 再 次 查询 就 立即 得 到 了 serial 字段 的 值 。 最 常见 的 
用 法 一 般 是 RETURNING *， 即 返回 所 有 字段 的 值 ， 但 也 可 以 指定 仅 返回 特定 字段 ， 如 示例 
7-16 所 示 。 


示例 7-16 在 UPDATE 语句 中 使 用 RETURNING 子 名 返回 修改 过 的 记录 
UPDATE census.Lu_fact_types ASf 
SET short_name = repLace(repLace(Lower(f.fact_subcats[4]),，' ','_'),':',"') 
WHERE f.fact_subcats[3] = 'Hispanic or Latino:' AND f.fact_subcats[4] > "' 
RETURNING fact_ type_id, short_name; 























| 
和 
| white_alone 
97 | black_or_african_american_alone 
| 
| 
| 
| 
| 


98 american_indian_and_alaska_native_alone 

99 asian_alone 

100 native_hawaiian_and_other_pacific islander_alone 
101 some_other_race_alone 

102 two_or_more_races 


7.2.11 UPSERT: INSERT 时 如 果 主 键 冲突 则 进行 UPDATE 


PostgreSQL 9.5 中 引入 了 新 的 INSERT ON CONFLICT 语 法， 业界 一 般 也 会 将 该 功能 称 为 
UPSERT。 当 无 法 确定 即将 插入 的 记录 是 否 会 与 表 中 现 有 的 记录 冲突 上 时， 就 可 以 使 用 UPSERT 
语法 来 确保 不 管 是 否 有 冲突 都 不 会 报错 ， 该 语法 允许 用 户 自 定 义 发 生 冲 突 时 的 行为 ， 要么 
更 新 现 有 i 记录， 要 么 直接 忽略 。 

使 用 该 特性 时 ， 表 上 一 定 要 有 一 个 唯一 性 约束 。 这 个 约束 可 以 是 唯一 性 字段 、 主 键 、 唯 一 
索引 或 者 排他 性 约束 。 一 旦 违反 该 约束 ， 用 户 可 以 决定 后 续 如 何 处 理 : 用 新 记录 和 覆盖 现 有 
记录 ， 或 者 什么 也 不 做 。 我 们 通过 一 个 例子 来 演示 其 用 法 ， 假 设 我 们 有 张 颜色 表 : 

CREATE TABLE colors(color varchar(50) PRIMARY KEY, hex varchar(6)); 


INSERT INTO colors(color, hex) 
VALUES('blue', 'O00Q00FF'), ('red', 'FF0O000'); 


上 面 刚刚 插入 了 一 条 记录 ， 接 下 来 继续 插入 一 些 可 能 会 与 表 中 已 有 记录 的 主键 重复 的 记录 
到 该 表 中 。 正 常情 况 下 ， 揪 入 主键 重复 的 记录 时 会 报 主 键 冲突 错误 。 在 示例 7-17 中 ,， 通 
过 使 用 UPSERT 我 们 实现 了 对 主键 冲突 错误 的 忽略 ， 最 后 的 结果 是 只 有 表 中 原来 不 存在 的 
green 记录 被 插入 成 功 。 如 果 后 续 再 次 执行 该 SQL， 由 于 所 有 主键 都 已 存在 ， 最 终 效 果 是 
` 会 往 表 中 插入 任何 新 记录 。 
示例 7-17 ”发 生 主 键 冲 突 时 忽略 冲突 记录 

INSERT INTO colors(color, hex) 


VALUES('blue', 'Q000FF'), ('red', 'FF0000'), ('green', 'Q0FF00') 
ON CONFLICT DO NOTHING ; 
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上 述 语句 的 保护 力度 还 不 够 。 如 果 有 人 插入 了 一 条 首 字母 大 写 的 “Blue” 的 记录 ， 由 于 与 
现 有 的 “blue” 并 没有 主键 冲突 ， 因 此 会 插入 成 功 ， 那 么 系统 中 实际 上 会 出 现 两 条 同样 表 
达 “ 蓝 色 ” 的 记录 ， 这 是 我 们 不 希望 见 到 的 。 此 时 可 以 通过 创建 一 个 唯一 索引 来 解决 ， 话 
法 如 下 所 示 。 


CREATE UNIQUE INDEX uidx_colors_lcolor ON colors USING btree(lower(color)); 


此 时 再 次 插入 “Blue” 记 录 则 会 被 唯一 索引 阻止 ， 而 且 由 于 我 们 定义 了 ON CONFLICT DO 
NOTHING， 也 就 是 冲突 时 什么 都 不 干 ， 所 以 效果 相当 于 什么 都 没 发 生 。 但 如 果 我 们 真 的 希望 
用 “Blue” 来 取代 表 中 已 有 的 “blue”， 则 可 以 使 用 示例 7-18 的 写法 。 

示例 7-18 ON CONFLIECT DO UPDATE 用 法 之 一 


INSERT INTO colors(color, hex) 
VALUES('BLue' ，'0000FF')，('Red'，'FF0000')，('Green'，'00FF00') 
ON CONFLICT( Lower(color)) 
DO UPDATE SET color = EXCLUDED.color, hex = EXCLUDED.hex; 


在 示例 7-18 中 我 们 设 定 了 ON CONFLICT 子 句 后 跟 的 唯一 性 字段 为 lower(color)， 该 字段 上 
需要 定义 有 唯一 约束 或 者 唯一 索引 ， 因 此 如 果 把 目标 字段 设 定 为 upper(color) 是 没有 意义 
的 ， 因 为 colors 表 上 没有 基于 uppser(color) 的 唯一 索引 。 


当 使 用 ON CONFLICT DO UPDATE 这 种 搭配 时 ，ON CONFLICT 后 需要 跟 唯 一 性 字段 或 者 唯一 约 
束 名 。 如 果 后 跟 唯一 性 约束 ， 则 需要 使 用 ON CONFLICT ON CONSTRAINT + 约束 名 的 语法 ， 如 
示例 7-19 所 示 。 

示例 7-19 ON CONFLICT DO UPDATE 用 法 之 二 


INSERT INTO colors(color, hex) 

VALUES('BLue' ，'0000FF')，('Red' ，'FF0000')，('Green'，'00FF00') 
ON CONFLICT ON CONSTRAINT coLors_pkey 
DO UPDATE SET color = EXCLUDED.color, hex = EXCLUDED.hex; 


只 有 当 违 反 主键 约束 、 唯 一 索引 或 者 唯一 键 值 约束 时 ，D0 子 句 才 会 被 触发 ， 整 体 语 句 不 会 
报错 。 但 如 果 发 生 了 数据 类 型 错误 或 是 违反 检查 约束 等 别 的 错误 ， 整 体 语句 还 是 会 报错 ， 
DO UPDATE 子 句 不 会 被 触发 。 


7.2.12 在 查询 中 使 用 复合 数据 类 型 

PostgreSQL 会 在 创建 表 时 自动 创建 一 个 结构 与 表 完 全 相同 的 数据 类 型 ， 其 中 包含 了 多 个 其 
他 数据 类 型 的 成 员 字 段 ， 因 此 也 会 被 称 为 复合 数据 类 型 。 你 第 一 次 见 到 基于 复合 数据 类 型 
的 查询 语句 时 ， 可 能 会 感到 很 惊讶 。 事 实 上， 你 可 能 已 经 在 编写 调试 SQL 语句 的 过 程 中 见 
识 过 它 的 神奇 之 处 。 先 看 一 下 这 个 语句 ; 


SELECT x FROM census.Lu_fact_types As x LIMIT 2; 


第 一 眼看 到 这 个 语句 时 ， 你 可 能 认为 我 们 漏 写 了 一 个 .*， 但 请 看 一 下 该 语句 的 执行 结果 : 











































































































(86,Population,"{D0O01,Total:}",d001) 
(87,Population,"{D002,Total:,""Not Hispanic or Latino:""}",d002) 
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语句 不 但 没有 报错 ， 而 且 返 回 的 结果 是 标准 的 Lu_fact_type 类 型 。 我 们 看 一 下 第 一 行 记 录 
的 内 容 来 确认 有 没有 问题 ，86 是 fact_type_id 字段 的 值 ，Population 是 category 字段 的 
值 ，{D991,Total:} 是 fact_subcats 属性 。 可 以 看 到 ， 字 段 值 与 表 定 义 完 全 匹配 ， 没 有 问 
题 。 复 合 数 据 类 型 可 以 作为 多 个 很 有 用 的 函数 的 输入 ， 比 如 array_agg 和 hstore (hstore 
扩展 包 提供 的 一 个 国 数 ， 可 以 将 一 行 记录 转换 为 hstore 的 一 个 键 值 对 象 ) 等 。 


如 果 你 正在 开发 Web 应 用 ， 那 么 建议 你 充分 利用 PostgreSQL 原生 支持 的 JSON 和 JSONB 
数据 类 型 的 强大 能 力 。 关 于 JSON 和 JSONB 的 详情 ， 请 参见 5.6 节 。 通 过 联 用 array_agg 
和 array_to_json 这 两 个 函数 ， 可 以 将 语句 的 查询 结果 转换 为 一 个 JSON 对 象 后 输出 ， 如 
示例 7-20 所 示 。 


示例 7-20 将 查询 结果 转换 为 JSON 格式 
SELECT array_to_json(array_agg(f)) As cat © 
FROM ( 
SELECT MAX(fact_type_id) As max_type, category @ 
FROM census .Lu_fact_types 
GROUP BY category 






































) As f; 
输出 结果 如 下 : 
cats 


[{"max_type":102,"category":"Population"}, 
{"max_type":153,"category":"Housing"}] 


@ 定义 一 个 名 为 f 的 子 查 询 ， 可 以 从 中 查 出 记录 。 
@ 使 用 array_agg 国 数 将 子 查询 返回 的 结果 集聚 合 为 一 个 数组 ， 然 后 将 这 个 结果 集 数组 通 
过 array_to_json 转变 为 一 个 JSON 字段 。 


PostgreSQL 9.3 版 提供 了 一 个 名 为 json_agg 的 国 数 ， 该 函数 的 效果 相当 于 上 面 示例 中 
array_to_json 和 array_agg 联 用 的 效果 ， 但 执行 速度 更 快 ， 使 用 起 来 也 更 方便 。 在 示例 
7-21 中 ， 我 们 使 用 json_agg 改写 了 示例 7-20 中 的 语句 ， 二 者 的 输出 是 相同 的 。 


示例 7-21 使 用 json_agg 将 查询 结果 转 为 JSON 格式 
SELECT json_agg(f) As cats 
FROM ( 
SELECT MAX(fact_ type_id) As max_type, category 
FROM census.luyu_fact types 
GROUP BY category 
) As f; 


7.2.13 ”使 用 $ 文 本 引用 符 


在 ANSI SQL 标准 中 ， 字 符 串 的 引用 符 是 单 引 号 (')。 但 如 果 字 符 串 内 容 本 身 就 含有 单 引 
号 则 会 遇 到 麻烦 ， 因 为 系统 不 知道 字符 串 到 底 在 哪里 截止 ， 此 时 就 需要 用 转 义 符 来 对 文本 
中 的 单 引 号 进行 转 义 。 文 本 中 含 单 引 号 的 情况 还 是 比较 普遍 的 ， 比 如 名 字 ONan， 再 比如 
从 属 关 系 表达 mon's place， 又 比如 缩写 can't。 我 们 需要 采用 在 前 面 另 加 一 个 单 引 号 的 方 
式 ， 对 单 引 号 进行 转 义 。 也 就 是 说 ， 字 符 串 内 容 中 看 起 来 是 两 个 单 引 号 连 写 ,但 其 实 表达 
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的 是 “单个 单 引号 ”这 一 内 容 。 比 如 你 需要 编写 一 个 INSERT 语句 ， 其 中 某 个 字段 的 内 容 是 

一 部 小 说 中 复制 出 来 的 大 段 文 字 ， 其 中 难免 会 有 单 引 号 。 如 果 在 这 大 恨 文 字 中 的 每 个 音 
引号 之 前 都 附加 一 个 单 引 号 来 进行 转 义 ， 这 项 工作 会 很 繁琐 ， 而 且 文 本 读 起 来 会 让 人 很 痛 
苦 ， 因 为 两 个 单 引 号 看 起 来 很 像 是 一 个 双 引 号 ， 但 二 者 又 根本 不 是 一 回 事 。 


为 了 解决 这 个 问题 ，PostgreSQL 支持 使 用 $$ 来 将 任意 长 度 的 文本 包 起 来 ， 这 样 就 可 以 不 
用 对 文本 中 的 单 引 号 做 转 义 处 理 。 


$ 引用 符 还 可 用 于 执行 动态 SQL 的 场景 ， 例 如 exec( 某 sql)。 在 示例 7-5 中 ， 我 们 就 使 用 
了 $$ 将 触发 器 的 定义 字符 串 包 起 来 。 


如 果 需 要 用 一 个 SQL 来 将 两 个 字符 串 拼接 起 来 ， 而 这 两 个 字符 串 中 又 含有 很 多 单 引 号 ， 那 
么 符合 ANSI 标准 的 写法 是 这 样 的 : 


SELECT 'It''s O''Neil''s play. ' || 'It''1l start at two o''clock.’ 
使 用 $$ 引用 符 看 起 来 是 这 样 的 : 

SELECT $$It's O'Neil's play. $$ || $SIt'LL start at two o'clock.$$ 

显然 简化 了 很 多 ， 也 更 加 清晰 易 懂 了。 
前 后 的 $$ 符 取 代 了 原本 的 单 引 号 文本 引用 符 ， 并 对 其 中 所 有 的 单 引 号 实现 了 转 义 。 
该 用 法 还 有 一 个 变种 ， 我 们 称 之 为 命名 $ 引用 符 ， 后 续 内 容 中 会 对 其 进行 介绍 。 




































































7.2.14 DO 


D0 命令 可 以 执行 一 个 基于 过 程式 语言 的 匿名 代码 段 ， 可 以 将 其 看 作 一 个 一 次 性 使 用 的 匿名 
函数 。 在 下 面 的 示例 中 ， 我 们 将 演示 如 何 通过 执行 一 个 匿名 代码 段 来 将 示例 3-10 中 插入 的 
数据 从 中 间 表 加 载 到 产品 表 中 。 示 例 中 的 匿名 代码 段 是 用 PL/pgSQL 编写 的 ， 但 你 也 可 以 
使 用 别 的 语言 编写 。 


首先 执行 建 表 操 作 : 


set search_path=census; 
DROP TABLE IF EXISTS lu fact types CASCADE; 
CREATE TABLE lu_fact types ( 
fact_type_id serial, 
category varchar(100), 
fact_subcats varchar(255)[], 
short_name varchar(50), 
CONSTRAINT pk_Lu_fact_types PRIMARY KEY (fact_type_id) 

















); 


然后 使 用 D0 语法 来 对 其 生成 一 些 记录 ， 如 示例 7-22 所 示 。 上 面 的 CASCADE 关键 字 的 效果 
是 将 该 表 所 有 的 关联 对 象 一 次 性 删除 ， 比 如 外 键 约束 、 视 图 等 。 因此， 使 用 CASCADE 关键 
字 时 要 特别 小 心 。 


示例 7-22 中 生成 了 一 系列 的 INSERT INTO SELECT 语句 ， 然 后 通过 这 些 语句 实现 数据 迁移 。 
这 些 SQL 还 实现 了 由 列 转行 的 转换 操作 。 












































示例 7-22 中 仅 包 含 了 为 Lu_fact_types 表 生 成 数据 的 部 分 代码 。 请 从 本 书 附 
加 的 代码 和 数据 资源 包 中 找到 building_census_tables.sql 这 个 脚本 ， 其 中 
有 完整 的 建 表 语句 。 











示例 7-22 使 用 D0 命令 来 生成 动态 SQL 
DO Language plpgsql 


$$ 
DECLARE var_sql text; 
BEGIN 
var_sql := string_agg( 
$ssql$s 上 
INSERT INTO Lu_fact_types(category，fact_subcats，short_name) 
SELECT 
"Housing ' ， 
array_agg(s$sql$ || lpad(i::text,2,'0') 
|| ') As fact_subcats,' 
|| quote literal('s' || lpad(i::text,2,'0')) || ' As short_name 
FROM staging.factfinder_import 
WHERE s' || lpad(I::text,2,'0') || $sql$ ~ '^[a-zA-Z]+' $sql$, ';" 
) 


FROM generate_series(1,51) As I; @ 
EXECUTE var_sql; © 

END 

$$; 


@ 这 里 使 用 了 $ 引用 符 ， 因 此 不 需要 为 后 面 的 Housing 前 后 的 单 引 号 进行 转 义 。 因 为 D0 
之 后 的 命令 是 用 $$ 引用 符 封 装 起 来 的 ， 所 以 这 里 需要 使 用 命名 的 $ 引用 符 而 不 能 使 用 
$$。 我 们 选择 的 是 $sqls$ 这 个 命名 引用 符 。 

@ 使 用 string_agg 函数 让 一 组 SQL 语句 形成 单一 字符 串 的 形式 INSERT INTO Lu_fact_ 
type(...) SELECT ... WHERE s01 ~ '[a-zA-Z]+';。 

@ 执行 该 SQL。 


在 示例 7-22 中 ， 使 用 了 7.2.13 节 中 介绍 过 的 $ 引用 符 ， 来 将 D0 之 后 的 函数 体 及 函数 体内 
部 的 一 些 SQL 语句 包 圳 了 起 来 。 由 于 同时 使 用 了 内 外 两 级 $ 引用 符 ， 所 以 如 果 对 这 两 级 引 
用 都 使 用 默认 的 $$ 引用 符 ， 会 造成 系统 无 法 分 清 每 一 级 引用 符 的 边界 在 哪里 。 此 时 我 们 
可 以 对 内 外 两 级 $3 引用 符 中 的 至 少 一 级 命名 (也 就 是 所 谓 的 “命名 $ 引用 符 ”) 以 示 区 分 ， 
当然 ， 把 内 外 两 级 都 改 为 命名 引用 符 也 是 可 以 的 。 


7.2.15 适用 于 聚合 操作 的 FILTER 子 名 


9.4 版 中 新 引入 了 用 于 聚合 操作 的 FILTER 子 句 ， 这 是 近期 ANSI SQL 标准 中 新 加 入 的 一 个 
关键 字 。 该 关键 字 用 于 替代 同 为 ANSI SQL 标准 语法 的 CASE WHEN 子 句 ， 使 聚合 操作 的 语 
法 得 以 简化 。 例 如 ， 假 设 你 需要 使 用 CASE WHEN 子 句 来 统计 每 个 学 生 不 同 科目 的 多 次 测试 
的 平均 成 绩 ， 语 法 如 示例 7-23 所 示 。 

示例 7-23 在 Ava 聚合 国 数 中 使 用 CASE WHEN 


SELECT student， 
AVG(CASE WHEN subject ='algebra' THEN score ELSE NULL END) As algebra, 
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AVG(CASE WHEN subject 
FROM test_scores 
GROUP BY student; 





='physics' THEN score ELSE NULL END) As physics 


用 FILTER 子 句 可 以 实现 与 上 面 语句 等 价 的 效果 ， 语 法 如 的 示例 7-24 所 示 。 
示例 7-24 AVG 聚合 国 数 与 FILTER 子 句 的 配合 使 用 











SELECT student, 


AVG(score) FILTER (WHERE subject ='algebra') As algebra, 
AVG(score) FILTER (WHERE subject ='physics') As physics 


FROM test_scores 
GROUP BY student; 


对 于 求 平 均值 、 求 合计 值 以 及 





其 他 很 多 聚合 国 数 来 说 ，CASE 和 FILTER 子 句 是 等 价 的 ， 即 





二 者 可 以 起 到 相同 的 作用 。FILTER 子 句 的 优势 在 于 写法 比较 清晰 简洁 ， 并 且 操 作 大 数据 量 
时 速度 比较 快 。CASE 语句 对 于 筛选 掉 的 字段 值 是 当成 NULL 处 理 的 ， 因 此 对 于 array_agg 这 
种 会 处 理 NULL 值 的 聚合 函数 来 说 ， 使 用 CASE WHEN 子 句 就 不 止 是 写法 繁琐 的 问题 了， 还 会 
导致 输出 不 想 要 的 结果 。 在 示例 7-25 中 ， 我 们 使 用 CASE.. .WHEN... 方法 查询 每 个 学 生 的 
各 门 课程 的 多 次 测试 成 绩 的 列表 来 演示 这 个 问题 。 


示例 7-25 CASE WHEN 子 名 与 array_agg 函数 配合 使 用 


























SELECT student, 




















array_agg(CASE WHEN subject ='aLgebra' THEN score ELSE NULL END) As algebra, 
array_agg(CASE WHEN subject ='physics' THEN score ELSE NULL END) As physics 


FROM test_scores 
GROUP BY student; 


student | algebra | physics 

es A a eh te es 本 开关 
jojo | {74,NULL,NULL,NULL,74,..} | {NULL,83,NULL,NULL,NULL,79,..} 
jdoe | {75,NULL,NULL,NULL,78,..} | {NULL,72,NULL,NULL,NULL,72..} 
robe | {68,NULL,NULL,NULL,77,..} | {NULL,83,NULL,NULL,NULL,85,..} 
lhsu | {84,NULL,NULL,NULL,80,..} | {NULL,72,NULL,NULL,NULL,72,..} 
(4 rows) 





可 以 看 到 示例 7-25 输出 的 成 绩 列 表 中 含有 很 多 的 NULL 值 。 这 个 问题 可 以 通过 使 用 子 查询 来 
解决 ， 但 比 起 使 用 FILTER 来 说 还 是 麻烦 又 低 效 。 示 例 7-26 中 演示 了 使 用 FILTER 时 的 写法 。 


示例 7-26 FILTER 子 句 与 array_agg 函数 的 配合 使 用 


SELECT student, 











array_agg(score) FILTER (WHERE subject ='aLgebra') As algebra, 
array_agg(score) FILTER (WHERE subject ='physics') As physics 


FROM test_scores 
GROUP BY student; 


student | algebra | physics 


We A 
jojo | {74,74} | {83,79} 
jdoe | {75,78} | {72,72} 
robe | {68,77} | {83,85} 
Lhsu | {84,80} | {72,72} 





FILTER 子 句 适用 于 所 有 聚合 函数 ， 不 仅仅 是 PostgreSQL 中 内 置 的 那些 聚合 函数 ， 通 过 安 
装 扩展 包 支 持 的 聚合 函数 也 是 可 以 用 的 。 


7.2.16 查询 百 分 位 数 与 最 高 出 现 频率 数 

PostgreSQL 9.4 中 开始 支持 用 于 计算 百 分 位 数 、 中 位 数 (等 同 于 0.5 百 分 位 数 ) 和 最 高 出 现 
频率 数 的 统计 函数 ， 具 体 包括 percentile_disc (用 于 计算 离散 百 分 位 )、percentile_cont 
(用 于 计算 连续 百 分 位 ) 以 及 mode 这 三 个 函数 。 

percentile_disc 和 percentile_cont 的 区 别 在 于 二 者 处 理 同一 百 分 位 命中 多 条 记录 的 方 
法 。 前 者 会 取 该 百 分 位 范围 内 的 第 一 条 命中 记录 的 值 ， 因 此 记录 顺序 会 对 最 终 返 回 哪 条 记 
录 产 生 影响 ， 后 者 会 把 百 分 位 范围 内 命中 的 所 有 记录 取 均 值 后 返 
中 位 数 就 是 百 分 位 值 等 于 0.5 的 百 分 位 数 ， 因 此 计算 中 位 数 不 需 要 一 个 专门 的 函数 。mode 
国 数 的 作用 是 取 分 组 中 出 现 频率 最 高 的 值 ， 如 果 最 高 频率 的 值 有 多 个 , 则 取 排 序 后 的 第 一 
个 ， 因 此 排序 方法 会 对 mode 计算 的 结果 有 影响 ， 如 示例 7-27 所 示 。 


示例 7-27 计算 中 位 数 和 出 现 频 率 最 高 的 成 绩 

SELECT 
student, 
percentile_cont(0.5) NITHIN GROUP (ORDER BY score) As cont_median, 
percentile disc(0.5) NITHIN GROUP (ORDER BY score) AS disc_median， 
mode() WITHIN GROUP (ORDER BY score) AS mode, 
COUNT(*) As num_scores 

FROM test_scores 

GROUP BY student 

ORDER BY student; 






































回 


















































student | cont median | disc median | mode | num_scores 


-------- +-------------+-------------+------+------------ 
alex | 78 | 77 | 74| 8 
leo | 72 | 72| 72| 8 
regina | 76 | 76 | 68 | 9 
sonia | 73.5 | 72 | 72| 8 
(4 rows) 


示例 7-27 同时 以 离散 模式 和 连续 模式 计算 了 学 生成 绩 的 中 位 数 ， 当 出 现 同 分 的 学 生 时 ， 计 
算 结 果 可 能 是 不 一 样 的 。 
一 般 的 聚合 国 数 是 直接 把 要 进行 聚合 运算 的 目标 字段 作为 入 参 ， 但 前 面 介 绍 的 这 几 个 国 数 
不 同 ， 它 们 的 直接 入 参 是 百 分 位 数 或 者 为 空 ， 目 标 聚 合 字段 是 通过 后 面 的 WITHIN GROUP 子 
名 中 的 ORDER BY 修饰 符 来 指定 的 。 
前 述 两 个 中 位 数 计算 函数 还 有 一 种 用 法 ， 即 可 以 输入 多 个 数字 作为 百 分 位 数 ， 从 而 实现 一 
次 查询 返回 匹配 多 个 百 分 位 数 的 多 个 目标 记录 。 示 例 7-28 通过 单条 SQL 语句 实现 了 一 次 
性 获取 中 位 数 记 录 、60% 分 位 数 记 录 以 及 最 高 分 记录 。 
示例 7-28 一 次 性 计算 多 个 百 分 位 数 

SELECT 

student, 
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percentile cont('{0.5,0.60,1}'::float[]) 


WITHIN GROUP (ORDER BY score) AS cont_median, 


percentile disc('{0.5,0.60,1}'::float[]) 


WITHIN GROUP (ORDER BY score) AS disc_median, 
COUNT(*) As num_scores 

FROM test_scores 

GROUP BY student 

ORDER BY student; 


student | cont_median | disc median | num_scores 
-------- +----------------+-------------+------------ 
alex | {78,79.2,84} | {77,79,84} | 8 

leo | {72,73.6,84} | {72,72,84} | 8 

regina | {76,76.8,90} | {76,77,90} | 9 

sonia | {73.5,75.6,86} | {72,75,86} | 8 

(4 rows) 

如 同 其 他 聚 


7-29 演示 了 如 何 将 WITHIN GROUP 与 FILTER 联 用 。 


示例 7- 


29 计算 两 个 科目 的 成 绩 中 位 数 


SELECT 


student, 


怀 合 函 数 一 样 ， 你 可 以 将 这 几 个 函数 与 聚合 函数 中 一 些 通 用 的 修饰 符 联 用 。 示 例 


percentile disc(0.5) WITHIN GROUP (ORDER BY score) 


FILTER (WHERE subject = 'algebra') AS algebra 


了 


percentiLLe_disc(0.5) NITHIN GROUP (ORDER BY score) 


FILTER (WHERE subject = 'physics') AS physics 


FROM test_scores 
GROUP BY student 
ORDER BY student; 


student | algebra | physics 


A a 
alex | 74 | 79 

leo | 80 | 72 
regina | 68 | 83 
sonia | 75 | 72 

(4 rows) 


7.3 


窗口 函数 





窗口 国 数 是 ANSI SQL 标准 中 规定 的 一 个 通用 特性 。 通 过 使 用 窗口 函数 ， 可 以 在 当前 记录 行 
中 访问 到 与 其 存在 特定 关系 的 其 他 记录 行 ， 相 当 于 在 每 行 记录 上 都 开 了 一 个 访问 外 部 数据 的 


窗口 ， 这 也 是 “窗口 国 数 ”这 个 名 称 的 由 来 。 窗口 ”就 是 当 
口 国 数 可 以 把 当前 行 的 “窗口 ”区 域内 的 记录 的 聚合 运算 结果 附加 到 当前 记录 行 。 





通过 窗 
row_num 























前 行 可 见 的 外 部 记录 行 的 范围 。 








du 























ber 和 rank 这 类 窗口 函数 色 g 够 基于 窗口 区 的 数据 实现 对 记录 生 了 的 复杂 排序 。 





如 果 不 














借助 窗口 函数 而 又 想 要 达到 相同 的 效果 ， 就 只 能 使 用 关联 操作 和 子 查询 。 表 面 上 
看 ， 使 用 窗口 函数 违 肯 了 SQL 语言 “基于 结果 集 ” 的 编程 
展 出 了 一 个 外 部 数据 域 。 但 从 另外 一 个 角度 看 ， 我 们 可 以 认为 窗口 国 数 本 质 上 仅 是 一 种 用 








思想 ， 因 为 它 为 每 一 行 数据 拓 





来 奉 代 关联 操作 和 子 查询 的 简写 语法 ， 也 就 是 说 窗口 国 数 并 未 突破 SQL 体系 原 有 的 运算 逻 
辑 ， 那 么 也 就 不 算 违反 了 “基于 结果 集 ” 的 思想 。 你 可 以 从 PostgreSQL 官方 手册 的 “窗口 
函数 ”一 市 中 看 到 更 多 说 明和 示例 。 


示例 7-30 可 帮助 你 理解 窗口 函数 的 基本 概念 。 通 过 使 用 窗口 函数 ， 可 以 在 单个 SELECT 语 
句 中 同时 获取 到 符合 fact_type_id=86 条 件 的 记录 的 均值 计算 结果 ， 以 及 原始 记录 的 详细 
信息 。 请 注意 ， 语 名 执行 时 总 是 先 筛 选 WHERE 条 件 再 计算 窗口 函数 ， 因 为 这 样 显然 可 以 避 
免 做 无 用 功 。 
示例 7-30 ”基本 的 窗口 函数 

SELECT tract_id, val, AVG(val) OVER () as val_avg 


FROM census .facts 
WHERE fact_type_id = 86; 


























tract_id | val | val_avg 

A nh Nc 
25001010100 | 2942.000 | 4430.0602165087956698 
25001010206 | 2750.000 | 4430.0602165087956698 
25001010208 | 2003.000 | 4430.0602165087956698 
25001010304 | 2421.000 | 4430.0602165087956698 


























OVER 子 句 限定 了 窗口 中 的 可 见 记录 范围 。 本 例 中 的 0VER 子 名 未 设 定 任何 条 件 ， 因 此 从 该 
窗口 中 能 看 见 全 表 的 所 有 记录 ， 所 以 AVERAGE 运算 的 结果 就 是 表 中 所 有 符合 fact_type_ 
id=86 条 件 的 记录 中 val 字段 的 平均 值 。 你 可 以 看 到 ， 通 过 为 其 增加 0VER 子 句 ， 我 们 把 一 
个 传统 的 AVG 聚合 运算 国 数 转变 成 了 一 个 窗口 函数 。PostgreSQL 在 遍历 每 一 行 记录 时 都 
会 基于 全 表 记 录 进 行 一 次 AVG 运算 ， 然 后 将 得 到 的 均值 作为 当前 行 的 一 个 字段 输出 。 由 
于 窗口 数据 域内 包含 多 条 记录 ， 这 意味 着 窗口 函数 运算 的 结果 一 定 在 多 条 记录 上 都 是 重复 
的 。 事实 上 ， 窗口 函数 实现 了 无 须 GROUP BY 的 聚合 运算 ， 还 实现 了 无 须 JOIN 的 关联 操作 ， 
从 而 将 窗口 函数 的 运算 结果 回填 到 记录 行 中 。 

所 有 SQL 聚合 国 数 都 可 以 通过 增加 OVER 子 句 的 方式 来 当 作 窗 口 函数 使 用 。 除 了 这 些 双重 
身份 的 函数 之 外 ， 系 统 中 还 有 ROW、RANK、LEAD 等 专门 的 窗口 函数 ， 你 可 以 从 PostgreSQL 
官方 手册 的 “窗口 函数 ”一 节 中 看 到 完整 的 窗口 函数 列表 。 



























































7.3.1 PARTITION BY 子 句 


窗口 函数 的 窗口 可 见 记录 范围 是 可 设置 的 ， 可 以 是 全 表 记 录 ， 也 可 以 是 与 当前 行 有 关联 关 
系 的 特定 记录 行 。 窗 口 可 见 记 录 范 围 的 设置 是 通过 PARTITION BY 子 句 实现 的 ， 它 可 以 指示 
PostgreSQL 仅 在 满足 条 件 的 特定 记录 集 上 执行 聚合 操作 。 示 例 7-31 的 查询 与 示例 7-30 类 
似 ， 但 要 求 各 县 级 编号 作为 窗口 筛选 条 件 ， 该 编号 束 是 tract_id 的 前 5 个 字符 。 这 样 就 实 
现 了 每 个 县 都 计算 各 自 的 平均 值 。 
示例 7-31 使 用 县 级 编号 作为 窗口 可 见 记录 范围 的 筛选 条 件 

SELECT tract_id, val, AVG(val) OVER (PARTITION BY Left(tract_id,5)) As val_avg_county 


FROM census .facts 
WHERE fact_type_id = 2 ORDER BY tract_id; 
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tract_id 

25001010100 
25001010206 
25001010208 


25003900100 
25003900200 
25003900300 


val_avg_county 


1709.9107142857142857 
1709.9107142857142857 
1709.9107142857142857 


1438.2307692307692308 
1438.2307692307692308 
1438.2307692307692308 


7.3.2 ”ORDER BY 子 句 
窗口 函数 的 OVER 子 句 中 还 可 以 使 用 ORDER BY 子 句 ， 其 作用 可 以 理解 为 对 窗口 可 见 范围 内 
的 所 有 记录 进行 排序 ， 并 且 窗 口 可 见 记录 域 是 从 结果 集 的 第 一 条 记录 开始 到 当前 记录 为 止 
的 范围 内 。 该 语法 的 典型 应 用 场景 就 是 用 ROW_NUMBER 函数 对 记录 集 编号。 示例 7-32 演示 





了 如 何 对 各 人 口 普查 

















区 记录 按照 其 名 称 顺 序 进 行 编号 。 


示例 7-32 使 用 Row_NUMBER 窗口 函数 进行 编号 操作 


示例 7-32 中 有 两 个 ORDER BY， 前 一 个 在 OVER 子 句 内 生效 ， 表 明 窗 口 可 见 


后 一 个 针对 整 句 生效 ， 表 明 返 回 记 录 的 整体 顺序 。 请 不 要 将 二 者 的 作用 域 混 淆 。 


SELECT ROW_NUMBER() OVER (ORDER BY tract name) As rnum, tract_name 


FROM census.lu_ tracts 
ORDER BY rnum LIMIT 4; 


rnum | tract_name 


a Se 
1 | Census Tract 1, Suffolk County, Massachusetts 

2 | Census Tract 1001, Suffolk County, Massachusetts 
3 | Census Tract 1002, Suffolk County, Massachusetts 
4 | Census Tract 1003, Suffolk County, Massachusetts 



































区 内 的 记录 顺序 ， 





PARTITION BY 和 ORDER BY 可 以 联 用 ， 其 效果 就 是 对 PARTITION BY 指定 的 记录 和 集 进行 排序 。 


示例 7-33 还 是 复 用 了 前 

















示例 7-33 联 用 PARTITION BY 和 ORDER BY 


SELECT tract_id, val, 

SUM(val) OVER (PARTITION BY left(tract id,5) ORDER BY val) As sum_county_ordered 
FROM census.facts 
WHERE fact type id = 2 
ORDER BY left(tract id,5), val; 


25001014100 
25001011700 
25001010208 


25003933200 
25003934200 


val | sum_county_ordered 
a A 
226.000 | 226.000 
971.000 | 1197.000 
984.000 | 2181.000 
564.000 | 564.000 
593.000 | 1157.000 
606.000 | 1763.000 


25003931300 





而 的 例子 ， 但 在 ovER 子 句 中 联 用 了 PARTITION BY 和 ORDER BY。 





| 大 


第 7 章 








可 以 看 到 ， 上 面 输出 的 合计 值 是 逐 行 累加 的 ， 这 就 是 在 OVER 子 句 中 应 用 了 ORDER BY 后 的 
效果 ， 即 窗口 可 见 域 是 从 排序 后 的 记录 集 的 头条 记录 开始 ， 到 ORDER BY 字段 值 与 当前 记录 
值 匹 配 的 那 行 记录 为 止 ， 因 此 最 终 会 呈现 为 动态 累加 的 效果 。 例 如 ， 对 于 第 三 个 数据 分 区 
中 的 第 五 条 记录 来 说 ， 合 计 值 仅 会 包含 该 分 区 中 的 前 五 条 记录 的 值 。 在 上 面 的 示例 中 ， 我 
们 在 语句 的 最 后 加 上 了 ORDER BY left(tract_id,5)，val 这 个 排序 动作 ， 因 此 动态 累加 效 
果 一 目 了 然 。 但 请 一 定 要 牢记 ，OVER 子 句 中 的 ORDER BY 与 整 句 尾 部 的 ORDER BY 的 作用 是 
完全 不 同 的 。 


你 还 可 以 通过 RANGE 或 者 RONS 关键 字 来 显 式 指定 窗口 的 可 见 记录 域 。 例 如 : ROWS BETWEEN 
CURRENT ROW AND 5 FOLLOWING, 


PostgreSQL 还 支持 建立 命名 窗口 ， 该 功能 适用 于 在 同一 个 查询 中 使 用 了 多 个 窗口 国 数 ， 且 
每 个 窗口 国 数 的 窗口 定义 都 相同 的 情况 。 示 例 7-34 演示 了 建立 命名 窗口 的 方法 ， 同 时 还 展 
示 了 LEAD 和 LAG 窗口 函数 的 用 法 ， 这 两 个 窗口 函数 可 以 取出 当前 窗口 中 排 在 当前 记录 行 之 
前 或 者 之 后 的 记录 。 


示例 7-34 ”命名 窗口 以 及 LEAD 和 LAG 函数 的 用 法 
SELECT * FROM ( 
SELECT 
ROW_NUMBER() OVER( wt ) As rnum，@ 
substring(tract_id,1, 5) As county_code, 
tract_id, 
LAG(tract_id,2) OVER wt As tract 2_before, 
LEAD(tract_id) OVER wt As tract after 
FROM census.Lu_tracts 
WINDOW wt AS (PARTITION BY substring(tract id,1，5) ORDER BY tract id) @ 
) As x 
WHERE rnum BETWEEN 2 and 3 AND county_code IN ('25007','25025') 
ORDER BY county_code, rnum; 
























































rnum | county_code | tract id | tract 2_before | tract_after 
----- +-------------+-------------+----------------+------------ 
2 | 25007 | 25007200200 | | 25007200300 
3 | 25007 | 25007200300 | 25007200100 | 25007200400 
2 | 25025 | 25025000201 | | 25025000202 
3 | 25025 | 25025000202 | 25025000100 | 25025000301 





@ 直接 复 用 窗口 名 ， 而 不 需要 把 窗口 的 完整 定义 再 输 一 遍 。 
@ 将 我 们 的 窗口 命名 为 wt 窗口 。 


LEAD 和 LAG 函数 都 有 一 个 可 选 的 step 参数 ， 该 参数 可 以 是 正 数 也 可 以 是 负数 ， 代 表 需 要 
从 当前 记录 开始 向 前 或 者 向 后 跳 几 条 记录 才能 访问 到 目标 记录 。 当 LEAD 和 LAG 在 寻找 目标 
记录 的 过 程 中 跳出 了 当前 窗口 的 可 见 域 时 ， 就 会 返回 NULL。 这 种 情况 经 常会 遇 到 。 

请 注意 : 在 PostgreSQL 中 ， 系 统 自 带 的 以 及 用 户 自 定 义 的 聚合 国 数 都 可 以 作为 窗口 国 数 使 


用 ， 但 其 他 数据 库 一 般 仅 支 持 AvG、SUM、MIN、MAX 这 些 系统 内 置 人 聚合 函数 作为 窗口 函数 
使 用 。 
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7.4 CTE 表 达 式 


公用 表 表 达 式 (CTE) 本 质 上 来 说 就 是 在 一 个 非常 庞大 的 SQL 语句 中 ， 人 允许 用 户 通过 一 个 
子 查 询 语句 先 定义 出 一 个 临时 表 ， 然 后 在 这 个 庞大 的 SQL 语句 的 不 同 地 方 都 可 以 直接 使 
用 这 个 临时 表 。CTE 本 质 上 就 是 当前 语句 执行 期 间 内 有 效 的 临时 表 ， 一 旦 当前 语句 执行 完 
毕 ， 其 内 部 的 CTE 表 也 随 之 失效 。 


有 以 下 三 种 类 型 的 CTE。 


基本 CTE 
这 是 最 普通 的 CTE， 它 可 以 使 SQL 语句 的 可 读 性 更 高 ， 同 时 规划 器 在 解析 到 这 种 CTE 
时 会 判定 其 查询 代价 是 否 很 高 ， 如 果 是 的 话 ， 会 考虑 将 其 查询 结果 临时 物化 存储 下 来 
(此 处 概念 跟 物化 视图 非常 类 似 )， 这 样 整个 SQL 语句 的 其 他 部 分 再 访问 此 CTE 时 就 会 
更 快 。 


可 写 CTE 
这 是 对 基本 CTE 的 一 个 功能 扩展 ， 其 内 部 可 以 执行 UPDATE、INSERT 或 者 DELETE 操作 。 
该 类 CTE 最 后 一 般 会 返回 修改 后 的 记录 集 。 


递归 CTE 
该 类 CTE 在 普通 CTE 的 基础 上 增加 了 一 个 循环 操作 。 在 执行 过 程 中 ， 递 归 CTE 返回 
的 结果 集会 有 所 变化 。 


PostgreSQL 支持 可 写 的 递归 CTE 这 种 复合 类 型 。 


7.4.1 基本 CTE 用 法 介绍 
基本 CTE 的 用 法 如 示例 7-35 所 示 。WITH 关键 字 后 面 跟 着 的 就 是 CTE 表达 式 。 


示例 7-35 基本 CTE 
WITH cte AS ( 
SELECT 
tract_id, substring(tract id,1, 5) As county_code， 
COUNT(*) OVER(PARTITION BY substring(tract id,1, 5)) As cnt_tracts 
FROM census.Lu_tracts 













































































) 

SELECT MAX(tract_id) As last tract, county_code, cnt_tracts 
FROM cte 

WHERE cnt_tracts > 100 

GROUP BY county_code, cnt_tracts; 


示例 7-35 中 CTE 表达 式 的 名 称 是 cte， 其 本 体 是 由 一 个 SELECT 语句 定义 出 来 的 ， 查 询 字 
段 列 表 中 包含 tract_id、country_code、cnt_tracts 三 个 列 。 外 围 的 SQL 语句 会 将 该 CTE 
作为 一 个 临时 表 来 使 用 。 
单个 SQL 语句 中 可 以 创建 多 个 CTE，CTE 之 间 使 用 逗号 分 隔 ， 所 有 的 CTE 表达 式 都 要 落 
在 WITH 子 名 范围 内 ， 有 具体 语 法 如 示例 7-36 所 示 。 多 个 CTE 表达 式 之 间 的 顺序 不 是 随便 排 
的 ， 排 在 后 面 的 CTE 可 以 引用 排 在 前 面 的 CTE， 但 反 过 来 不 行 。 除 了 这 一 点 以 外 ， 多 个 





























CTE 之 间 的 排列 顺序 没有 别 的 讲究 。 


示例 7-36 多 个 CTE 的 用 法 
WITH 
ctel AS( 

SELECT 
tract_id, 
substring(tract _ id,1, 5) As county_code, 
COUNT(*) OVER (PARTITION BY substring(tract id,1,5)) As cnt_tracts 

FROM census.lu_ tracts 


MAX(tract_id) As Last_tract， 
County_code， 
cnt_tracts 
FROM ctel 
WHERE cnt_tracts < 8 GROUP BY county_code, cnt_tracts 


SELECT c.last_tract, f.fact_ type_id, f.val 
FROM census.facts As f INNER JOIN cte2 C ON f.tract id = c.last tract; 


7.4.2 可 写 CTE 用 法 介绍 


可 写 CTE 扩展 了 CTE 的 功能 范畴 ， 从 只 读 扩展 为 可 写 。 下 面 使 用 示例 6-3 中 创建 的 日 志 
表 来 演示 此 功能 。 首 先 创建 一 个 子 表 : 


CREATE TABLE logs 2011 01 02 ( 
PRIMARY KEY (log_id), 
CONSTRAINT chk 
CHECK (log_ts >= '2011-01-01' AND log ts < '2011-03-01') 

















INHERITS (logs_2011); 


在 示例 7-37 中 ， 我 们 将 父 表 的 部 分 数据 迁移 到 子 表 中 。 父 表 包 含 了 2011 年 全 年 的 数据 ， 
子 表 包 含 了 2011 年 1 月 和 2 月 的 数据 。 下 面 的 语句 中 使 用 的 ONLY 关键 字 在 7.2.8 节 中 有 相 
关 介 绍 ， 而 RETURNING 关键 字 在 7.2.10 节 中 有 相关 介绍 。 


示例 7-37 使 用 可 写 CTE 将 数据 从 一 个 分 支 移动 到 另 一 个 分 支 
WITH t AS ( 
DELETE FROM ONLY logs_2011 WHERE Log_ts < '2011-03-01' RETURNING * 











INSERT INTO logs_2011 01 02 SELECT * FROM 七 


7.4.3 递归 CTE 用 法 介绍 

PostgreSQL 官方 手册 中 对 递归 CTE 做 了 最 好 的 说 明 :“ 通 过 新 增 一 个 可 选 的 RECURSIVE 修 
饰 符 ， 使 CTE 从 仅仅 能 提供 一 些 语法 便利 升华 为 能 够 实现 标准 SQL 语法 无 法 实现 的 功 
能 。” 递归 CTE 能 够 使 用 递归 语法 构造 出 一 个 表达 式 ， 这 一 点 很 有 意思 。 弟 归 CTE 使 用 
UNION ALL 语法 来 实现 每 次 运算 过 程 中 的 运算 结果 的 递归 累积 。 
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如 果 要 将 一 个 基本 CTE 转换 为 递归 CTE， 需 要 在 WITH 后 加 上 RECURSIVE 修饰 符 。WITH 








RECURSIVE 后 站 





i 可 以 附带 由 递归 表达 式 和 非 递 归 表 达 式 结合 而 成 的 语句 。 在 大 多 数 其 他 数 











据 库 中 ， 如 果 要 表达 递归 关系 ， 并 不 需要 显 式 指定 RECURSIVE 关键 字 。 

递归 CTE 常用 于 表达 消息 线程 和 其 他 树 状 结构 。 博 文 “Recursive CTE to Display Tree 
Structures” 中 提供 了 一 个 这 方面 的 例子 。 

在 示例 7-38 中 ， 我 们 通过 查询 系统 catalog 来 展示 数据 库 中 的 级 联 表 关系 。 


示例 7-38 递归 CTE 
WITH RECURSIVE tbls AS ( 
SELECT 


C 
n 
C 

FROM 



































.0id As tableoid, 
.nspname AS schemaname, 
.relname AS tabLename © 


pg_class C LEFT JOIN 

pg_namespace n ON n.oid = c.reLnamespace LEFT JOIN 
pg_tablespace t ON t.oid = c.reltablespace LEFT JOIN 
pg_inherits As th ON th.inhrelid = c.oid 


WHERE 


th.inhrelid IS NULL AND 


c.relkind = 


r'::"char" AND c.relhassubclass 


UNION ALL 
SELECT 
c.oid As tableoid, 
n.nspname AS schemaname, 
tbLs .tabLename || '->' || c.relname AS tablenane @ © 


FROM 


tbls INNER JOIN 


pg_inherits As th ON th.inhparent = tbls.tableoid INNER JOIN 

pg_class c ON th.inhrelid = c.oid LEFT JOIN 

pg_namespace n ON n.oid = c.relnamespace LEFT JOIN 
pg_tablespace t ON t.oid = c.reltablespace 


) 
SELECT * FROM tbls ORDER BY tabLename; @ 


tableoid | schemaname | tablename 


pi Oe ea A 
3152249 | public | logs 

3152260 | public | Logs->Logs_2011 

3152272 | public | logs->logs_2011->logs_2011 01_02 








@ 查询 出 所 有 有 子 表 而 无 父 表 的 表 。 

@ 这 是 递归 查询 部 分 ， 查 询 出 了 所 有 位 于 tbls 临时 表 中 的 表 的 子 表 。 

@ 输出 时 在 父 表 名 之 后 附加 子 表 的 名 称 。 

@ 输出 父 表 和 所 有 子 表 。 因 为 语句 中 要 求 输出 结果 按照 表 名 排序 ， 而 每 一 层级 的 表 名 是 









































将 父 表 的 名 称 排 在 子 表 之 前 ， 所 以 排序 后 的 效果 就 是 子 表 记 录 紧 跟 在 其 父 表 记录 之 后 


输出 。 











7.5 LATERAL 横 向 关 联 语法 





LATERAL 是 9.3 版 中 新 支持 的 ANSI SQL 标准 语法 。 该 语法 的 用 途 是 : 假设 你 需要 对 两 张 
表 或 者 两 个 子 查询 进行 关联 查询 操作 ， 那 么 参与 关联 运算 的 双方 是 独立 的 ， 互 相 不 能 读 取 
对 方 的 数据 。 例 如 ， 下 面 的 查询 语 名 会 报错 ， 因 为 L.year=2611 不 是 位 于 关联 的 右 侧 的 一 




















个 列 。 
SELECT * 
FROM 
Census .facts L 
INNER JOIN 
( 


SELECT * 
FROM census.lu_fact types 
WHERE category = CASE WHEN L.yr = 2011 
THEN 'Housing' ELSE category END 
)R 
ON L.fact_ type_id = R.fact type_id; 


加 上 了 LATERAL 关键 字 后 就 不 会 再 报错 : 


SELECT * 
FROM 
census.facts L INNER JOIN LATERAL 


( 





SELECT * 
FROM census.Lu_fact_types 
WHERE category = CASE NHEN L.yr = 2011 
THEN 'Housing' ELSE category END 
) R 
ON L.fact_type_id = R.fact type_id; 


通过 使 用 LATERAL 语法 ， 可 以 在 一 个 FROM 子 句 中 跨 两 个 表 共 享 多 列 中 的 数据 。 但 有 个 限制 


就 是 仅 支持 单 向 共享 ， 即 右 侧 的 表 可 以 提取 左 侧 表 中 的 数据 ， 但 反 过 来 不 行 。 








有 时 候 ， 为 了 避免 编写 语法 极其 复杂 的 语句 ， 也 需要 使 用 LATERAL 语法 。 在 示例 7-39 中 ， 


关联 关系 中 左 侧 的 一 个 列 充当 了 右 侧 generate_series 国 数 的 一 个 形 参 。 


CREATE TABLE interval_periods(i type interval); 
INSERT INTO interval_periods (i_type) 
VALUES ('5 months'), ('132 days'), ('4862 hours ' ) ; 





示例 7-39 ”LATERAL 语法 和 generate_series 畏 数 的 关联 使 用 
SELECT i_type, dt 
FROM 
interval_periods CROSS JOIN LATERAL 
generate_series('2012-01-01'::date, '2012-12-31'::date, i type) AS dt 
WHERE NOT (dt = '2012-01-01' AND i_type = '132 days'::interval); 


i_type | dt 

SS Py 
5 mons | 2012-01-01 00:00:00-05 
5 mons | 2012-06-01 00:00:00-04 
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5 mons | 2012-11-01 00:00:00-04 
132 days | 2012-05-12 00:00:00-04 
132 days | 2012-09-21 00:00:00-04 
4862:00:00 | 2012-01-01 00:00:00-05 
4862:00:00 | 2012-07-21 15:00:00-04 


LATERAL 语法 还 可 用 于 以 下 场景 : 通过 关联 关系 左 侧 的 数据 来 限制 右 侧 的 查询 结果 集中 包 
含 的 记录 数量 。 在 示例 7-40 中 ， 我 们 使 用 LATERAL 语法 查询 出 最 近 100 天 之 内 登录 过 我 们 
网 站 (http://www.postgresonline.com) 的 超级 用 户 最 近 5 次 登录 的 时 间 和 操作 日 志 。 本 例 
中 使 用 的 表 是 在 6.1.5 节 和 6.1.1 节 中 创建 的 。 


示例 7-40 ”使 用 LATERAL 语法 来 限制 关联 查询 中 的 一 方 返回 的 记录 数 
SELECT U.User_name，L.description，L.Log_ts 
FROM 
super_users AS U CROSS JOIN LATERAL ( 
SELECT description, log_ts 
FROM logs 
WHERE 
Log_ts > CURRENT_TIMESTAMP - interval '100 days' AND 
Logs.User_name = U.User_name 
ORDER BY Log_ts DESC LIMIT 5 
) AS 1L; 


虽然 你 也 可 以 通过 窗口 函数 来 实现 相同 的 效果 ， 但 LATERAL 关联 执行 速度 更 快 ， 语 法 也 更 
在 同一 条 SQL 语句 中 可 以 多 次 使 用 LATERAL 关联 ， 当 需要 关联 多 个 子 查询 时 ， 甚 至 可 以 级 
联 使 用 LATERAL。 在 有 的 场景 下 可 以 省 略 LATERAL 关键 字 ， 此 时 规划 器 会 根据 关联 关系 的 
两 边 交 又 引用 的 情况 智能 判断 出 这 是 一 个 LATERAL 操作 。 但 为 了 清晰 起 见 ， 最 好 显 式 指定 
LATERAL 关键 字 。 在 不 支持 LATERAL 语法 的 PostgreSQL 版 本 上 执行 带 横向 引用 的 SQL 语句 
当然 会 报错 。 不 显 式 指 明 LATERAL 关键 字 还 有 一 个 风险 ， 就 是 可 能 会 造成 规划 器 误 判 ， 最 
终生 成 的 执行 计划 可 能 完全 不 是 你 想 要 的 。 

其 他 数据 库 中 也 提供 了 横向 关联 的 能 力 ,但 其 语法 不 符合 ANSI SQL 规范 的 要 求 。 在 Oracle 
中 ， 横 向 关联 通过 管道 图 数 实现 ， 在 SQL Server 中 使 用 CROSS APPLY 或 者 OUTER APPLY 语法 


7.6 WITH 0ORDINALITY 子 名 


PostgreSQL 9.4 开始 支持 ANSI SQL 标准 中 规定 的 WITH ORDINALITY 语法 。WITH ORDINALITY 
子 句 的 作用 是 为 函数 返回 的 结果 集中 的 每 一 行 自动 附加 一 个 序列 号 字段 。 






































在 普通 的 表 查 询 语句 和 子 查询 语句 中 不 可 以 使 用 WITH ORDINALITY 语法 ,但 
可 以 使 用 ROW_NUMBER 窗口 函数 ， 效 果 相同 。 











你 会 发 现 ，WITH ORDINALITY 经 常 与 generate_series、unnest 之 类 可 以 将 复合 数据 类 型 和 
数组 展开 的 函数 联 用 。 事 实 上 ，WITH ORDINALTY 语法 可 与 任何 返回 多 条 记录 的 函数 联 用 ， 
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包括 用 户 自 定义 的 函数 。 
示例 7-41 演示 了 WITH ORDINALITY 与 generate_series 国 数 生成 的 临时 变量 联 用 的 场景 。 
示例 7-41 对 函数 返回 的 多 条 记录 结果 进行 编号 

SELECT dt.* 


FROM generate_series('2016-01-01'::date,'2016-12-31'::date,interval '1 month') 
WITH ORDINALITY As dt; 





dt | ordinality 
a i 
2016-01-01 00:00:00-05 | 4 
2016-02-01 00:00:00-05 | 2 
2016-03-01 00:00:00-05 | 3 
2016-04-01 00:00:00-04 | 4 
2016-05-01 00:00:00-04 | 5 
2016-06-01 00:00:00-04 | 6 
2016-07-01 00:00:00-04 | 7 
2016-08-01 00:00:00-04 | 8 
2016-09-01 00:00:00-04 | 9 
2016-10-01 00:00:00-04 | 10 
2016-11-01 00:00:00-04 | 11 
2016-12-01 00:00:00-05 | 12 


(12 rows) 








WITH ORDINALITY 会 在 查询 结果 的 最 后 增加 一 个 名 为 ordinality 的 字段 ，WITH ORDINALITY 
子 句 只 能 出 现在 SQL 语句 的 FROM 子 句 中 。ordinality 字段 可 以 改 为 其 他 名 字 。 


WITH ORDINALITY 子 名 与 LATERAL 语法 经 常会 联 用 。 在 示例 7-42 中 ， 我 们 复 用 了 示例 7-39 
中 的 LATERAL 例句 ， 同 时 为 返回 的 记录 增加 了 一 个 序列 号 。 


示例 7-42 将 WITH ORDINALITY 与 LATERAL 联 用 


SELECT d.ord, i type, d.dt 
FROM 
interval_periods CROSS JOIN LATERAL 
generate_series('2012-01-01'::date, '2012-12-31'::date, i_ type) 
WITH ORDINALITY AS d(dt,ord) 
WHERE NOT (dt = '2012-01-01' AND i type = '132 days'::interval); 














ord | i type | dt 

Er i ne 
1 | 5 mons | 2012-01-01 00:00:00-05 
2 | 5 mons | 2012-06-01 00:00:00-04 
3 | 5 mons | 2012-11-01 00:00:00-04 
2 | 132 days | 2012-05-12 00:00:00-04 
3 | 132 days | 2012-09-21 00:00:00-04 
1 | 4862:00:00 | 2012-01-01 00:00:00-05 
2 | 4862:00:00 | 2012-07-21 15:00:00-04 


(7 rows) 


在 示例 7-42 中 ，WITH ORDINALITY 与 返回 多 行 记录 的 函数 联 用 ， 它 只 能 在 WHERE 子 句 之 前 
的 FROM 部 分 生效 ， 因 此 查询 得 到 的 最 终结 有 果 中 会 出 现 序 号 非 连 续 的 情况 (比如 上 例 中 的 
132 days 对 应 的 序号 1 就 没有 了 )， 其 原因 是 有 的 记录 被 WHERE 条 件 过 滤 掉 了 。 
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7.7 GROUPING SETS、CUBE 和 ROLLUP 语 法 


如 果 你 需要 创建 一 个 包含 总 计 和 分 子 类 总 计 的 报表 ，GROUPING SETS 就 是 为 这 种 场景 
定做 的 。 


还 是 以 前 面 使 用 的 学 生 测试 成 绩 表 为 例 。 如 果 需 要 同时 统计 每 个 学 生 的 综合 平均 分 和 每 个 
科目 的 平均 分 ， 可 以 写 一 个 类 似 示 例 7-43 的 SQL 语句 来 达成 目标 ， 其 中 使 用 了 GROUPING 
SETS 语法 。 


示例 7-43 ”统计 每 个 学 生 的 综合 平均 分 以 及 每 个 学 生 分 科目 的 平均 分 
SELECT student, subject, AVG(score)::numeric(10,2) 
FROM test_scores 
WHERE student IN ('leo','regina') 
GROUP BY GROUPING SETS ((student),(student,subject)) 
ORDER BY student, subject NULLS LAST; 





有 


身 

















student | subject | avg 
a Ee 
leo | algebra | 82.00 
leo | calculus | 65.50 
leo | chemistry | 75.50 
leo | physics | 72.00 
leo | NULL | 73.75 
regina | algebra | 72.50 
regina | calculus | 64.50 
regina | chemistry | 73.50 
regina | economics | 90.00 
regina | physics | 84.00 
regina | NULL | 75.44 
(11 rows) 


示例 7-43 通过 单个 SQL 语句 就 统计 出 了 每 个 学 生 所 有 科目 的 平均 分 以 及 每 个 学 生 每 个 科 
目的 平均 分 。 


同 理 ， 我 们 甚至 能 够 再 加 上 每 门 科 目 所 有 学 生 的 平均 分 ， 依 然 是 借助 GROUPING SETS 的 能 
力 来 实现 ， 如 示例 7-44 所 示 。 


示例 7-44 ”统计 每 个 学 生 的 综合 平均 分 、 每 个 学 生 分 科目 的 平均 分 以 及 某 个 科目 所 有 学 
生 的 平均 分 
SELECT student, subject, AVG(score)::numeric(10,2) 
FROM test_scores 
WHERE student IN ('leo','regina') 
GROUP BY GROUPING SETS ((student ,subject),(student),(subject)) 
ORDER BY student NULLS LAST，subject NULLS LAST; 

















student | subject | avg 

a Er ee 
leo | algebra | 82.00 
leo | calculus | 65.50 
leo | chemistry | 75.50 
leo | physics | 72.00 
leo | NULL | 73.75 





regina | 
regina | 
regina | 
regina | 
regina | 
regina | 
NULL | 
NULL | 
NULL | 
NULL | 
NULL | 
(16 rows) 


如 果 和 希望 一 次 ; 


局 综合 平均 分 


algebra 
calculus 
chemistry 
economics 
physics 
NULL 
algebra 
calculus 
chemistry 
economics 
physics 


性 统计 





| 72. 
| 64. 
| 73. 
| 90. 
| 84. 
| 75. 
ea 
| 65. 
| 74. 
| 90. 
| 78. 


50 
50 
50 
00 
00 
44 
25 
00 
50 
00 
00 


出 每 个 学 生 的 综合 平均 分 、 每 个 学 生 分 科目 的 综合 平均 分 和 全 
， 该 怎么 办 呢 ? 可 以 


巴 查询 修改 为 GROUPING SETS((student),(student， 











subject),())， 这 种 递 进 式 的 分 组 聚合 可 以 用 ROLLUP(student,subject) 来 表达 ， 有 具体 参见 


示例 7-45。 


示例 7-45 ”统计 每 个 学 生 的 综合 平均 分 、 每 个 学 生 分 科目 的 平均 分 以 及 全 局 综合 平均 分 
SELECT student, subject, AVG(score)::numeric(10,2) 
FROM test_scores 


WHERE student IN ('leo','regina') 
GROUP BY ROLLUP (student,subject) 


ORDER BY student NULLS LAST, subject NULLS LAST; 


regina 
regina 
regina 
regina 
regina 
regina 
NULL 

(12 rows) 


| 
+ 
| 
| 
| 
| 
leo | 
| 
| 
| 
| 
| 
| 
| 


algebra 
calculus 
chemistry 
physics 
NULL 
algebra 
calculus 
chemistry 
economics 
physics 
NULL 

NULL 


如 果 把 ROLLUP 的 入 参 字段 顺序 反 过 来 ， 那 么 得 到 的 是 每 个 学 生 分 科目 的 平均 分 、 每 个 科目 
的 平均 分 、 全 局 综合 平均 分 ， 如 示例 7-46 所 示 。 
示例 7-46 ”统计 每 个 学 生 分 科目 的 平均 分 、 每 个 科目 的 平均 分 、 全 局 综合 平均 分 


SELECT student, subject, AVG(score)::numeric(10,2) 
FROM test_scores 


WHERE student IN ('leo','regina') 
GROUP BY ROLLUP (subject,student) 


ORDER BY student NULLS LAST, subject NULLS LAST; 





PostgreSQL 的 特色 SQL 语法 | 169 


Leo | aLgebra | 82.00 
Leo | calculus | 65.50 
Leo | chemistry | 75.50 
Leo | physics | 72.00 
regina | algebra | 72.50 
regina | calculus | 64.50 
regina | chemistry | 73.50 
regina | economics | 90.00 
regina | physics | 84.00 
NULL | algebra | 77.25 
NULL | calculus | 65.00 
NULL | chemistry | 74.50 
NULL | economics | 90.00 
NULL | physics | 78.00 
NULL | NULL | 74.65 
(15 rows) 


如 果 和 希望 把 前 两 种 统计 的 结果 综合 一 下 ， 即 包含 每 个 学 生 所 有 科目 的 综合 平均 分 、 每 个 科 
目 所 有 学 生 的 综合 平均 分 、 每 个 学 生 每 个 科目 的 平均 分 以 及 全 局 不 分 科目 和 学 生 的 综合 平 
均 分 ， 那 么 可 以 写成 GROUPING SETS((student)，(student，subject)，(subject)，())， 或 
者 可 以 使 用 CuBE(student，subject) 语法 ， 如 示例 7-47 所 示 。 


示例 7-47 统计 每 个 学 生 所 有 科目 的 综合 平均 分 、 每 个 科目 所 有 学 生 的 综合 平均 分 、 
每 个 学 生 每 个 科目 的 平均 分 以 及 全 局 不 分 科目 和 学 生 的 综合 平均 分 


SELECT student, subject, AVG(score)::numeric(10,2) 
FROM test_scores 

WHERE student IN ('leo','regina') 

GROUP BY CUBE (student, subject) 

ORDER BY student NULLS LAST, subject NULLS LAST; 


student | subject | avg 
ER 全 
leo | algebra | 82.00 
leo | calculus | 65.50 
leo | chemistry | 75.50 
leo | physics | 72.00 
leo | NULL | 73.75 
regina | algebra | 72.50 
regina | calculus | 64.50 
regina | chemistry | 73.50 
regina | economics | 90.00 
regina | physics | 84.00 
regina | NULL | 75.44 
NULL | algebra | 77.25 
NULL | calculus | 65.00 
NULL | chemistry | 74.50 
NULL | economics | 90.00 
NULL | physics | 78.00 
NULL | NULL | 74.65 
(17 rows) 
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函数 编写 





PostgreSQL 同 大 多 数 数据 库 一 样 ， 可 以 把 若干 SQL 语句 组 合 在 一 起 ， 然 后 将 其 作为 一 个 
单元 来 处 理 ， 并 且 每 次 运行 时 可 以 输入 不 同 的 参数 。 这 种 机 制 在 不 同 数 据 库 中 的 名 称 不 一 
样 ， 有 的 叫 存储 过 程 ， 有 的 叫 用 户 自 定义 函数 ， 而 PostgreSQL 统一 称 之 为 函数 。 


函数 不 是 仅仅 将 一 堆 SQL 语句 编排 在 一 起 即 可 ， 其 中 还 需要 使 用 过 程式 语言 (procedural 
language，PL) 来 对 SQL 语句 的 执行 过 程 进行 控制 。 在 PostgreSQL 中 ， 你 可 以 选择 使 用 
不 同 的 语言 来 编写 国 数 ， 而 且 可 选择 的 语言 有 很 多 ， 其 中 SQL、C、PL/pgSQL、PL/Perl 
以 及 PL/Python 一 般 都 会 随 PostgreSQL 安装 包 附 带 。 此 外 还 支持 使 用 PL/V8 语言 ， 通 过 
它 你 可 以 使 用 JavaScript 语言 来 编写 函数 。PL/V8 是 Web 开发 人 员 的 最 爱 ， 因 为 JSON、 
JSONB 数据 类 型 和 JavaScript 语言 是 绝 配 。 关 于 JSON 和 JSONB 数据 类 型 的 详情 ， 请 参 
考 5.6 市 。 


你 还 可 以 按 需 安装 PL/R、PL/Java、PL/sh、PL/TSQL 等 语言 扩展 ， 此 外 还 有 一 些 用 于 高 端 
数据 处 理 以 及 人 工 智 能 处 理 的 试验 性 语言 ， 比 如 PL/Scheme 和 PL/OpenCL 等 。 你 可 以 在 
官方 手册 的 “过 程式 语言 ”一 节 中 查 到 PostgreSQL 支持 的 完整 语言 列表 。 

8.1 PostgreSQL 函数 功能 剖析 

PostgreSQL 的 函数 可 分 为 基本 函数 、 聚 合 函 数 、 窗 口 函数 和 触发 器 函数 四 大 类 。 我 们 首先 
介绍 关于 函数 的 基础 知识 ， 然 后 再 详细 介绍 前 述 每 类 函数 的 具体 特性 。 

8.1.1 函数 功能 基础 知识 介绍 


在 PostgreSQL 中 ， 不 管 你 选择 使 用 何 种 编程 语言 ， 所 编写 出 来 的 函数 的 结构 都 是 类 似 的 ， 
如 示例 8-1 所 示 。 
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示例 8-1 函数 的 基本 结构 
CREATE OR REPLACE FUNCTION func_name(arg1 arg1_datatype DEFAULT arg1_default) 
RETURNS some type / set of some type | TABLE (..) AS 
$$ 
BODY of function 
$$ 
LANGUAGE language of _function 


参数 可 以 有 默认 值 。 函 数 调 用 者 可 以 忽略 有 默认 值 的 参数 ， 即 不 用 为 其 输入 值 ， 直 接 采 用 
默认 值 即 可 。 在 函数 定义 中 ， 可 选 参数 必须 排列 在 必 选 参数 的 后 面 。 


和 人参 支 持 命名 参数 和 匿名 参数 两 种 形式 ， 前 者 必须 为 参数 起 个 名 字 ， 而 后 者 不 需要 。 我 们 
建议 使 用 命名 参数 ， 因 为 这 样 可 以 在 函数 体内 通过 参数 名 引用 它 ， 非 常 方便 和 直观 。 假 设 
我 们 定义 了 一 个 可 以 接受 三 个 人 参 的 函数 〈 其 中 两 个 人 参 是 可 选 的 ) 如 下 : 


big_elephant(ear_size numeric, skin_color text DEFAULT "btLue ' ， 
name text DEFAULT 'Dumbo') 


你 可 以 在 函数 体内 部 通过 参数 名 引用 这 些 入 参 (ear_size、skin_color 等 )。 如 果 参 数 是 
名 的 ， 那 么 只 能 通过 序列 号 的 方式 来 访问 它 : $1、$2 和 $3。 

如 果 使 用 了 命名 参数 ， 那 么 调用 国 数 时 还 可 以 采用 以 下 带 入 参 名 的 调用 方式 ， 该 方式 的 好 
处 是 参数 输入 顺序 与 定义 时 的 顺序 不 必 完 全 相同 : 


big_eLephant(name => 'Wooly', ear_size => 1.2) 


即使 函数 定义 时 使 用 了 命名 入 参 ， 也 可 以 按照 参数 位 置 来 输入 而 不 必 带 上 参数 的 名 字 ， 比 
如 big_elephant(1.2，'blue' ，'WootLy')。 那 么 什么 时 候 需 要 使 用 带 入 参 名 的 调用 方式 呢 ? 如 
果 函 数 有 多 个 入 参 ， 并 且 其 中 大 部 分 都 是 可 选 的 ， 那 么 此 时 适合 使 用 带 参数 名 的 调用 方式 。 
该 方式 可 以 实现 覆盖 参数 默认 值 ， 而 且 参 数 的 输入 顺序 与 定义 时 的 顺序 不 必 相 同 。 以 上 面 对 
big_elephant 函数 的 调用 为 例 ，skin_color 参数 未 出 现 ， 因 此 会 取 默 认 值 'blue' ，name 参数 的 
值 会 覆盖 默认 值 ， 而 且 name 定义 时 在 最 后 ， 调 用 时 却 放 在 了 第 一 个 。 如 果 按 参数 位 置 的 形式 
来 调用 ， 那 么 要 想 给 name 赋值 以 覆盖 其 默认 值 的 话 ，skin_cotLor 参数 就 必须 要 显 式 输入 。 


在 PostgreSQL 9.5 以 及 更 高 的 版 本 中 ， 带 参数 名 的 调用 语法 是 类 似 name => 
'Wooly' 这 样 的 ， 但 是 在 PostgreSQL 9.4 以 及 之 前 的 版 本 中 ， 语 法 是 name := 
'Wooly' 。 为 保证 前 向 兼容 ，argl_name := arg1_value 这 种 语法 在 PostgreSQL 
9.5 及 之 后 的 版 本 中 仍 是 支持 的 ， 但 不 建议 继续 使 用 ， 因 为 将 来 会 不 再 支持 。 




















加 | 


















































定义 函数 时 可 以 添加 一 些 标记 符 来 优化 执行 效率 或 者 提升 安全 性 ， 支 持 的 标记 符 如 下 。 

LANGUAGE 《使 用 的 编程 语言 
旨 明 本 函数 使 用 的 编程 语言 ， 当 然 该 语言 必须 在 当前 函数 所 在 的 database 中 已 安装 。 执 
行 SELECT Lanname FROM pg_Language; 即 可 查 到 已 安装 的 语言 列表 。 

VOLATILITY (结果 的 稳定 性 ) 
该 标记 符 可 以 告诉 查询 规划 器 ， 当 该 函数 执行 完毕 后 ， 得 到 的 结果 是 否 可 以 缓存 下 来 以 
供 下 次 使 用 。 它 有 以 下 几 个 可 选 值 。 
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IMMUTABLE 〈 结 果 恒 定 不 变 ) 
任何 情况 下 ， 只 要 调用 该 函数 时 使 用 相同 的 输入 ， 就 总 会 得 到 相同 的 输出 。 也 就 是 
说 ， 该 函数 的 内 部 逻辑 对 外 界 完 全 无 依赖 。 这 类 函数 最 典型 的 例子 是 数学 计算 函数 。 
注意 ， 定 义 函 数 索 引 时 必须 使 用 IMMUTABLE 函数 。 

STABLE 《结果 相对 稳定 ) 
如 果 在 同一 个 查询 语句 中 多 次 调用 该 函数 ， 则 每 次 调用 时 只 要 使 用 相同 的 输入 就 总 
会 得 到 相同 的 输出 。 也 就 是 说 ,该 函数 的 内 部 逻辑 在 当前 SQL 的 上 下 文 环境 内 是 有 
恒定 输出 的 。 

VOLATILE (结果 不 稳定 ) 

每 次 调用 该 函数 得 到 的 结果 可 能 都 不 同 ， 即 便 每 次 都 使 用 相同 的 输入 也 是 这 样 。 那 
些 更 改 数据 的 函数 和 那些 依赖 系统 时 间 这 类 环境 设置 的 函数 就 属于 VOLATILE 类 型 。 
该 项 也 是 默认 值 。 


请 注意 ，VOLATILITY 标记 符 仅仅 是 给 规划 器 提供 了 一 个 提示 信息 ， 规 划 器 并 不 一 定 
会 按照 此 设置 来 进行 处 理 。 如 果 函 数 被 标记 为 VOLATILE， 那 么 规划 器 每 次 遇 到 此 函 
数 都 会 重新 解析 并 重新 执行 一 遍 ， 如 果 被 标记 为 别 的 类 型 ， 那 么 规划 器 也 可 能 不 会 
对 其 执行 结果 进行 缓存 ， 因 为 规划 器 可 能 认为 重新 计算 一 遍 反而 会 更 快 。 

STRICT 〈 严 格 模式 
对 于 一 个 严格 模式 的 函数 来 说 ， 如 果 有 任何 输入 为 NULL， 则 规划 器 根本 不 会 执行 这 个 
国 数 ， 直 接 返 回 NULL。 如 果 示 显 式 指 定 为 STRICT 模式 ， 则 函数 默认 都 是 非 严 格 模 式 的 。 
写 函 数 时 ， 务必 慎 用 STRICT， 因 为 用 了 以 后 可 能 会 导致 规划 器 不 使 用 索引 。 请 参考 我 
们 的 博文 “STRICT on SQL Functions” 以 获取 更 多 细节 。 


COST 〈 执 行 成 本 估计 ) 
这 是 标记 函数 中 计算 操作 密集 程度 的 一 个 相对 度量 值 。 如 果 使 用 的 是 SQL 或 PL/pgSQL 
语言 ， 则 该 值 为 990， 如 果 使 用 C 语言 ， 则 该 值 为 1。 该 值 会 影响 到 规划 器 执行 WHERE 
子 句 中 的 函数 时 的 优先 级 ， 也 会 影响 到 是 否 对 此 函数 进行 结果 集 缓存 的 可 能 性 判定 。 此 
值 越 大 ， 则 规划 器 会 认为 执行 该 函数 需要 耗费 的 时 间 越 多 。 


ROWS (返回 结果 集 的 行 数 估计 ) 
仅 当 函数 返回 的 是 一 个 结果 集 时 ， 此 标记 符 才 有 用 。 该 值 是 返回 的 结果 集中 记录 数 的 一 
个 估计 值 。 规 划 器 会 利用 此 数值 来 为 此 函数 分 析 得 出 最 佳 的 执行 策略 。 


SECURITY DEFINER (安全 控制 符 ) 
如 果 设 置 了 安全 控制 符 ， 则 会 以 创建 此 函数 的 用 户 的 权限 执行 此 函数 ， 如 果 未 设置 ， 则 
会 以 调用 此 函数 的 用 户 的 权限 执行 此 函数 。 如 果 某 用 户 对 某 张 表 没 有 操作 权限 而 又 需要 
操作 该 表 ， 那 么 就 可 以 让 创建 该 表 的 用 户 提供 一 个 带 SECURITY DEFINER 标识 的 函数 来 
对 此 表 进 行 操作 。 可 以 看 出 ， 当 需要 进行 表 的 访问 权 控制 时 ， 这 个 安全 控制 符 还 是 很 有 
用 的 。 

PARALLEL 〈 并 行 度 ) 
该 标记 符 是 PostgreSQL 9.6 新 引入 的 。 该 标记 表示 人 允许 规划 器 以 并 行 模式 运行 。 默 认 情 
况 下 ， 国 数 会 被 设置 为 PARALLEL UNSAFE， 这 意味 着 任何 调用 该 函数 的 语句 都 不 会 被 分 


























































































































布 到 多 个 工作 进程 上 去 并 发 执行 。 详 情 请 参考 官方 手册 “并 行 安全 性 ”相关 内 容 。 支 持 
的 选项 如 下 。 
SAFE 
该 选项 表示 允许 该 函数 被 并 行 执 行 。 如 果 函 数 是 IMMUTABLE 类 型 的 ， 或 者 函数 不 更 
新 数据 或 者 不 会 修改 事务 状态 或 其 他 变量 值 ， 那 么 将 其 设 为 SAFE 一 般 是 没 问 题 的 。 
UNSAFE 
如 果 函 数 会 修改 非 临 时 数据 、 访 问 序列 号 生成 器 或 者 事务 状态 ， 那 么 都 应 被 设置 为 
UNSAFE。UNSAFE 的 函数 如 果 以 并 行 模式 执行 可 能 会 导致 表 数 据 被 破坏 或 者 其 他 系统 
状态 被 破坏 ， 因 此 不 允许 被 并 行 执行 。 
RESTRICTED 
对 于 使 用 临时 表 、 预 解析 语句 或 者 客户 端 连接 状态 的 函数 可 以 使 用 该 选项 。 设 置 为 
RESTRICTED 的 语句 不 会 被 禁止 并 行 执 行 ， 但 是 它 只 能 运行 在 并 行 组 中 的 领导 组 (lead) 
中 ， 也 就 是 说 该 函数 本 身 不 会 被 并 行 执行 ， 但 它 不 会 阻止 调用 它 的 SQL 语句 被 并 行 执行 。 
本 章 的 很 多 例子 中 都 带 有 PARALLEL 标记 符 ， 如 果 你 的 试验 环境 是 PostgreSQL 9.6 之 前 
的 版 本 ， 请 在 执行 例子 时 把 PARALLEL 标记 去 掉 。 


8.1.2 ”触发 器 和 触发 器 函数 

任何 一 个 功能 健全 的 数据 库 都 支持 触发 器 功能 。 借 助 触发 器 机 制 ， 可 以 实现 自动 捕捉 数 
据 变化 事件 并 进行 相应 处 理 。PostgreSQL 既 支 持 对 表 创 建 触发 器 ， 也 支持 对 视图 创建 触 
发 絮 。 

可 以 指定 触发 器 在 语句 级 或 者 记录 级 被 触发 。 对 语句 级 触发 器 来 说 ， 每 执行 一 条 SQL 语句 
只 会 被 触发 一 次 ， 对 记录 级 触发 器 来 说 ，SQL 语句 执行 过 程 中 每 修改 一 条 记录 就 会 被 触发 
一 次 。 例 如 ， 假 设 你 对 某 表 执行 了 一 个 UPDATE 语句 ， 更 新 了 1500 条 记录 。 那 么 该 表 上 的 
语句 级 触发 器 只 会 触发 一 次 ， 而 记录 级 触发 器 会 触发 1500 次 。 


你 还 可 以 更 加 精细 地 设置 触发 器 的 触发 时 机 ， 系 统 支持 BEFORE、AFTER 以 及 INSTEAD OF 这 
三 种 时 机 。BEFORE 类 的 触发 器 会 在 语句 执行 之 前 或 者 记录 行 被 修改 之 前 触发 ， 你 可 以 借 此 
时 机 来 取消 此 次 修改 或 者 对 要 修改 的 数据 进行 预先 备份 。AFTER 类 的 触发 器 会 在 语句 执行 
之 后 或 者 记录 行 被 修改 之 后 触发 ， 你 可 以 借 此 时 机 来 获得 修改 后 的 新 值 ， 该 类 触发 器 一 般 
用 于 记录 修改 日 志 或 者 进行 数据 复制 。INSTEAD OF 类 的 触发 器 会 将 原 语句 的 操作 内 容 替 换 
掉 。BEFORE 和 AFTER 类 的 触发 器 只 能 用 于 表 ， 而 INSTEAD OF 类 的 触发 器 只 能 用 于 视图 。 


注意 ， 如 果 要 在 触发 器 函数 中 进行 数据 修改 ， 那 么 该 触发 器 的 触发 时 机 一 定 只 能 是 BEFORE 
类 的 ， 因 为 在 AFTER 阶段 所 有 针对 新 记录 的 修改 操作 都 会 被 忽略 。 

你 还 可 以 在 定义 触发 器 时 加 上 WHEN 条 件 ， 以 限定 只 有 那些 满足 筛选 条 件 的 记录 被 修改 时 
才 激 活该 触发 器 ， 也 可 以 通过 加 上 “upDATE 0F+ 字段 列表 ” 子 句 来 指定 只 有 修改 了 特定 的 
列 时 才 激 活该 触发 器 。 如 果 和 希望 更 加 深入 细致 地 了 解 触发 器 与 主体 语句 之 间 的 触发 联动 机 
制 ， 请 参考 PostgreSQL 官方 手册 中 的 “触发 器 行为 概览 ”一 节 的 内 容 。 我 们 还 在 示例 7-5 
中 演示 了 一 个 视图 触发 器 的 用 法 。 
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PostgreSQL 提供 了 一 种 专门 用 于 处 理 触发 器 逻辑 的 函数 ， 称 为 触发 器 函数 ， 其 行为 模式 与 
其 他 国 数 类 似 ， 内 部 的 代码 结构 也 相同 。 触 发 器 函数 与 普通 国 数 的 唯一 区 别 在 于 输入 形 参 
和 输出 类 型 。 触 发 器 函数 从 不 需要 参数 ， 因 为 可 以 在 函数 内 部 访问 数据 并 对 其 进行 修改 。 


触发 器 函数 的 返回 值 永远 是 trigger 类 型 。PostgreSQL 的 触发 器 函数 与 其 他 函数 类 似 ， 因 
此 一 个 触发 器 函数 可 以 被 多 个 触发 器 共用 。 儿 乎 没有 哪 家 数据 库 能 支持 该 特性 ， 因 为 一 般 
的 数据 库 中 都 是 把 触发 器 和 触发 器 函数 作为 一 个 完整 的 对 象 绑 定 在 一 起 的 ， 这 样 的 触发 器 
处 理 逻 辑 无 法 被 别 的 触发 器 重用 。 


在 PostgreSQL 中 ， 每 个 触发 器 有 且 仅 有 一 个 配套 的 触发 器 函数 。 如 果 由 于 业务 需要 必须 将 
逻辑 分 散 到 多 个 触发 器 函数 中 ， 那 么 就 得 创建 多 个 触发 器 来 调用 它们 ， 这 些 触 发 器 的 触发 
事件 可 以 相同 也 可 以 不 同 。 如 果 触 发 事件 相同 的 话 ， 那 么 系统 会 将 触发 器 名 称 按 字典 顺序 
进行 排序 ， 然 后 逐个 触发 。 后 一 个 触发 器 可 以 看 到 前 一 个 触发 器 的 修改 结果 。 每 一 个 触发 
器 并 不 是 一 个 独立 的 事务 ， 因 此 如 果 在 某 个 触发 器 中 执行 了 回 滚 操作 ， 那 么 在 此 触发 器 之 
前 执行 过 的 触发 器 修改 都 会 被 回 滚 掉 。 


你 可 以 使 用 PostgreSQL 支持 的 任何 一 种 编程 语言 来 编写 触发 器 函数 ， 但 注意 不 能 使 用 
SQL， 因 为 它 不 是 过 程式 语言 。SQL 对 应 的 过 程式 语言 是 PL/pgSQL， 它 也 是 目前 为 止 在 
PostgreSQL 环境 中 使 用 最 广泛 的 语言 。8.3.2 市 会 演示 如 何 使 用 PL/pgSQL 编写 触发 器 国 数 。 


8.1.3 聚合 操作 


大 多 数 其 他 数据 库 仅 允许 使 用 ANSI SQL 标准 中 定义 的 那些 聚合 函数 ， 比 如 MIN、MAX、 
AVG、SUM 和 COUNT 等 。 在 PostgreSQL 中 则 无 此 限制 ， 你 可 以 自行 实现 比 以 上 函数 功能 更 复 
杂 的 聚合 国 数 。 在 PostgreSQL 中 ， 一 个 聚合 函数 同时 也 可 以 作为 窗口 函数 (相关 概念 请 参 
见 7.3 节 ) 来 使 用 ， 因 此 你 可 以 实现 事半功倍 的 效果 。 


你 可 以 使 用 PostgreSQL 所 支持 的 几乎 任何 语言 (包括 SQL 语言 在 内 ) 来 编写 聚合 函数 。 
聚合 函数 一 般 是 基于 一 个 或 者 多 个 子 函数 实现 的 。 首 先 至 少 得 有 一 个 状态 转换 函数 ， 该 函 
数 会 反复 执行 多 次 ， 以 将 输入 的 多 行 记录 聚合 为 一 个 单独 的 结果 。 你 还 可 以 建立 用 于 处 理 
初始 状态 和 终结 状态 的 函数 ， 不 过 这 两 个 函数 是 可 选 的。 前 述 这 几 类 函数 都 是 聚合 函数 的 
子 函数 ， 它 们 可 以 使 用 不 同 的 编程 语言 来 实现 ， 我 们 在 “PostgreSQL Aggregates” 这 篇 博 
文中 演示 了 基于 PL/pgSQL、PL/Python 和 SQL 等 多 种 语言 的 子 函 数 构 造 而 成 的 聚合 函数 
示例 。 
不 管 你 使 用 何 种 编程 语言 来 编写 这 些 子 图 数 ， 最 终 将 它们 整合 为 一 个 聚合 函数 的 语法 是 一 
样 的 ， 如 下 所 示 。 

CREATE AGGREGATE my _agg (input data type) ( 

SFUNC=state function name， 

STYPE=state type， 

FINALFUNC=final function name， 

INITCOND=initial state value, SORTOP=sort_operator 

); 
SFUNC 状态 切换 函数 (这 个 名 称 不 够 直观 ， 此 处 所 谓 的 “状态 ”是 指 在 聚合 运算 过 程 中 每 
处 理 完 一 条 记录 后 得 到 的 中 间 结 果 ) 是 实现 聚合 运算 的 逻辑 主体 ， 它 会 将 自身 上 一 次 被 调 












































































































































用 后 生成 的 计算 结果 作为 本 次 计算 的 输入 ， 同 时 输入 的 还 有 当前 新 一 条 的 待 处 理 记录 ， 这 
样 将 所 有 记录 一 条 条 累积 处 理 完毕 后 ， 就 得 到 了 基于 整个 目标 记录 集 的 “状态 ”， 也 就 是 
最 终 的 聚合 结果 。 有 的 情况 下 ，SFUNC 处 理 得 到 的 结果 就 是 聚合 函数 需要 的 最 终结 果 ， 但 
另外 一 些 情况 下 ，SFUNC 处 理 完毕 的 结果 还 需要 再 进行 最 终 加 工 才 是 我 们 想 要 的 聚合 结果 ， 
FINALFUNC 就 是 负责 这 个 最 终 加 工 步 又 的 函数 。FINALFUNC 是 可 选 的 ， 由 于 它 的 作用 是 对 
SFUNC 函数 的 输出 结果 做 最 后 加 工 ， 因 此 它 的 输入 一 定 是 SFUNC 函数 的 输出 。INITCOND 也 
是 可 选 的 ， 如 果 设 定 了 该 条 目 ， 那 么 其 值 会 被 作为 SFUNC 函数 的 “状态 ”的 初始 值 。 


最 后 的 SORTOP 也 是 可 选 的 ， 甚 值 是 类 似 于 > 或 < 这 样 的 运算 符 ， 它 的 作用 是 为 类 似 MAX、 
MIN 这 样 的 排序 操作 指定 排序 运算 符 。 指 定 了 SORTOP 运算 符 后 ， 规 划 器 会 使 用 索引 来 进行 
MAX、MIN 这 样 的 聚合 运算 ， 由 于 索引 是 有 序 的 ， 所 以 可 以 快速 定位 到 索引 的 头 部 或 者 尾部 
以 寻找 MAX、MIN 值 ， 这 样 就 不 需要 对 所 有 记录 逐条 进行 大 小 值 判 断 ， 整 体 运 算 速度 也 得 以 
极 大 提升 。 不 过 SORTOP 运算 符 的 使 用 有 一 个 先决 条 件 ， 那 就 是 在 聚合 运算 的 目标 表 上 ， 以 
下 两 条 语句 的 执行 结果 必须 完全 相同 。 

SELECT agg(col) FROM sometable; 

SELECT col FROM sometable ORDER BY col USING sortop LIMIT 1; 





































































































在 PostgreSQL 9.4 中 ，CREATE AGGREGATE 语法 得 到 了 强化 ， 新 增 了 对 移动 窗 
口 聚合 函数 的 支持 ， 该 特性 对 于 窗口 可 移动 的 窗口 函数 是 很 有 意义 的 。 详 情 
请 参考 9.4 版 官方 手册 中 的 “创建 聚合 国 数 ”一 节 的 内 容 。 

















在 PostgreSQL 9.6 中 ,聚合 函 数 也 开始 支持 并 行 执行 。 通 过 设置 函数 的 
parallel 属性 来 指定 某 个 函数 是 否 启用 并 行 ， 具体 可 以 设 为 safe、unsafe、 
restricted 这 几 个 值 。 如 果 不 设 ， 默 认 是 unsafe。 除 了 parallel 属性 ， 还 增 
加 了 combinefunc、serialfunc 和 deserialfunc 这 几 个 并 行 聚合 相关 的 属性 。 
详情 请 参考 官方 手册 中 的 “SQL 创建 聚合 函数 ”一 节 的 内 容 。 
































一 般 来 说 ， 聚 合 国 数 只 针对 一 个 列 进行 聚合 运算 ， 比 如 MAX、MIN、AvG 等 ， 但 事实 上 完全 
可 以 创建 针对 多 个 列 进行 聚合 运算 的 聚合 国 数 。 如 果 你 需要 这 样 的 多 列 聚 合 国 数 ， 请 参考 
“How to Create Multi-Column Aggregates” 这 篇 博文 来 了 解 具体 的 实现 方法 。 

前 面 已 经 介绍 过 聚合 国 数 是 可 以 使 用 SQL 来 编写 的 。SQL 是 一 种 极其 易 用 的 语言 ， 你 不 
需要 关心 那些 各 式 各 样 的 流程 控制 语句 〈 因 为 SQL 中 不 支持 ) ， 而 且 你 可 能 对 SQL 已 经 很 
熟悉 ， 因 此 上 手 更 加 简单 。 当 编写 聚合 函数 时 ， 仅 仅 使 用 SQL 就 可 以 实现 很 强大 的 功能 。 
我 们 将 在 8.2.2 节 中 介绍 相关 内 容 。 


8.1.4 ”受信 与 非 受信 语言 

PostgreSQL 支持 的 函数 语言 可 按照 信任 级 别 分 为 两 类 : 受信 语言 与 非 受信 语言 。 很 多 语言 
(但 并 不 是 所 有 ) 同时 提供 了 受信 与 非 受信 版 本 。 这 里 所 说 的 “受信 ”是 指 该 语言 不 可 能 
对 数据 库 服 务 器 的 底层 操作 系统 造成 任何 破坏 ， 这 一 点 是 通过 拒绝 它 执 行 操作 系统 的 高 风 
仿 操 作 来 保证 的 。 简 要 介绍 如 下 。 
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受信 语言 不 具备 直接 访问 数据 库 服务 器 底层 文件 系统 的 权限 ， 因 此 在 该 类 语言 中 不 能 

直接 执行 操作 系统 级 命令 。 任 何 权 限 级 别 的 用 户 都 可 以 使 用 受信 语言 创建 函数 。 包 括 
SQL、PL/pgSQL、PL/Perl 和 PL/V38 在 内 的 语言 都 是 受信 语言 。 

非 受信 语言 
非 受信 语言 可 以 直接 与 操作 系统 进行 交互 ， 通 过 该 类 语言 可 以 直接 调用 操作 系统 提供 的 
国 数 和 Web 服务 接口 。PostgreSQL 中 只 有 超级 用 户 才 有 权 使 用 非 受 信 语 言 编写 函数 ， 
但 超级 用 户 有 权 将 基于 非 受信 语言 的 函数 的 执行 权限 授予 普通 用 户 。 一 般 来 说 ， 非 受信 
语言 的 命名 会 以 U 结尾 ， 比 如 PL/PerlU、PL/PythonU 等 。 这 一 点 并 不 绝对 ， 比 如 PL/R 
就 是 个 例外 。 


8.2 ”使 用 SQL 语言 来 编写 函数 


大 多 数 情况 下 ， 我 们 仅仅 使 用 SQL 语言 来 编写 单个 语句 ， 但 事实 上 它 也 可 以 用 于 编写 图 
数 。 在 PostgreSQL 中 ， 将 现 有 的 一 条 SQL 语句 改造 为 函数 是 一 件 又 快 又 简单 的 事情 : 只 
需 在 现成 的 SQL 基础 上 加 上 函数 头 和 函数 尾 就 可 以 了 。 但 编写 简单 同时 也 意味 着 功能 
限 。SQL 不 是 一 种 过 程式 语言 ， 因 此 你 无 法 用 上 条 件 分 支 判 断 、 循 环 或 者 定义 变量 等 过 
程式 语言 的 特性 。 此 外 还 有 一 个 更 严重 的 限制 ， 那 就 是 无 法 执行 使 用 函数 入 参 动 态 拼装 的 
SQL 语句 。 


当然 ，SQL 函数 也 有 其 优点 。 查 询 规划 器 可 以 深入 到 SQL 函数 内 部 ， 并 对 其 中 每 一 条 
SQL 语句 进行 分 析 和 优化 ， 该 过 程 被 称 为 inlining， 即 内 联 处 理 。 对 于 别 的 语言 编写 的 函 
数 ， 规 划 器 只 能 将 其 当成 黑 盒 处 理 。 只 有 SQL 函数 可 以 被 内 联 处 理 ， 这 使 得 SQL 函数 能 
够 充分 利用 索引 并 减少 重复 计算 。 


8.2.1 编写 基本 的 SQL 函数 
示例 8-2 演示 了 一 个 最 基本 的 SQL 函数 ， 该 函数 向 表 中 插入 一 条 记录 ， 并 返回 一 个 标量 值 。 
示例 8-2 创建 一 个 SQL 函数 ， 其 返回 值 为 新 插入 的 记录 的 唯一 ID 


CREATE OR _ REPLACE FUNCTION write to_log(param user_name varchar, 
param_description text) 

RETURNS integer AS 

$$ 

INSERT INTO logs(user_name, description) VALUES($1, $2) 
RETURNING Log_id; 

$$ 

LANGUAGE 'sql' VOLATILE; 


国 数 的 调用 语法 如 下 所 示 。 
SELECT write_ to_log('alex', 'Logged in at 11:59 AM.') As new_id; 


类 似 地 ， 也 可 以 在 SQL 函数 中 更 新 数据 并 返回 一 个 标量 或 者 不 返回 ， 如 示例 8-3 所 示 。 





































































































示例 8-3 ”创建 一 个 进行 更 新 操作 的 SQL 函数 


通过 


基本 上 所 有 编程 语言 编写 的 函数 都 支持 返回 结果 集 ，SQL 函数 也 不 例外 ， 它 有 三 种 返回 结 





CREATE OR REPLACE FUNCTION 
update_logs(log id int, param_ user_name varchar, param_ description text) 
RETURNS void AS 
$$ 
UPDATE logs SET User_name = $2, description = $3 
, log_ ts = CURRENT_TIMESTAMP WHERE log id = $1; 


$$ 
LANGUAGE 'sql' VOLATILE; 
以 下 语句 来 调用 此 函数 。 


SELECT update_ logs(12, 'alex', 'Fell back asleep.'); 











果 集 的 方法 : 第 一 种 是 ANSI SQL 标准 中 规定 的 RETURNS TABLE 语法 ， 第 二 种 是 使 用 OUT 


形 参 


参 ， 第 三 种 是 使 用 复合 数据 类 型 。 其 他 数据 库 一 般 也 都 是 基于 RETURNS TABLE 语法 来 实 


现 结 








果 集 的 返回 。 示 例 8-4 演示 了 如 何 使 用 这 三 种 方法 来 实现 返回 结果 集 。 








示例 8-4 在 函数 中 返回 结果 集 
使 用 RETURNS TABLE 语法 的 方式 如 下 所 示 。 





CREATE OR _ REPLACE FUNCTION seLect_Logs_rt(param_user_name varchar) 

RETURNS TABLE (log_id int, user_name varchar(50), 

description text, log_ts timestamptz) AS 

$$ 

SELECT log_id, user_name, description, log_ts FROM logs WHERE user_name = $1; 
$$ 

LANGUAGE 'sql' STABLE PARALLEL SAFE; 


使 用 OUT 形 参 的 方式 如 下 所 示 。 


CREATE OR REPLACE FUNCTION select_logs_out(param user_name varchar, OUT log_id int 
,OUT user_name varchar, OUT description text, OUT Log_ts timestamptz) 

RETURNS SETOF record AS 

$$ 

SELECT * FROM Logs WHERE user_name = $1; 

$$ 

LANGUAGE 'sql' STABLE PARALLEL SAFE; 


使 用 复合 数据 类 型 的 方式 如 下 所 示 。 


CREATE OR REPLACE FUNCTION select_logs_so(param user_name varchar) 
RETURNS SETOF logs AS 

$$ 

SELECT * FROM Logs WHERE User_name = $1; 

$$ 

LANGUAGE 'sql' STABLE PARALLEL SAFE; 


以 上 三 种 方式 实现 的 函数 的 调用 方法 都 是 一 样 的 。 


SELECT * FROM select _ logs xxx('alex'); 





8.2.2 ”使 用 SQL 语言 编写 聚合 函数 

是 的 ! 你 没 看 错 ，PostgreSQL 支持 用 户 在 常见 的 MIN、MAX、COUNT、AVG 等 聚合 函数 之 外 
自 定义 聚合 函数 。 本 节 将 演示 如 何 使 用 SQL 语言 来 创建 一 个 用 于 计算 几何 平均 值 的 聚 
合 函 数 。 几 何平 均值 是 指 n 个 正 数 的 连 乘积 的 n 次 方 根 ((x1*x2*x3...xn)"")， 它 在 金 
融 、 经 济 以 及 统计 学 领域 有 着 广泛 的 应 用 。 当 样本 数字 的 值 域 范 围 变 化 很 大 时 ， 可 以 使 
用 几何 平均 值 来 替代 更 常见 的 算术 平均 数 。 几 何平 均值 可 以 使 用 更 高 效 的 公式 来 计算 : 
EXP(SUMCLN(x) )/n) ， 该 公式 使 用 了 对 数 来 将 连续 的 乘法 运算 转换 为 连续 的 加 法 运算 ， 因 此 
计算 机 执行 的 效率 更 高 。 在 下 面 的 例子 中 ， 我 们 将 使 用 该 公式 计算 几何 平均 值 。 

为 了 构造 几何 平均 值 聚合 图 数 ， 需 要 创建 两 个 子 国 数 : 一 个 状态 转换 图 数 ， 用 于 把 对 数 运 
算 结 果 相 加 (参见 示例 8-5) ; 一 个 最 终 处 理 函 数 ， 用 于 对 对 数 之 和 进行 取 和 窜 运 算 。 此 外 还 
需要 指定 状态 初始 值 为 0。 

示例 8-5 ”创建 几何 平均 值 聚 合 函 数 的 状态 切换 函数 


CREATE OR REPLACE FUNCTION geom mean_state(prev numeric[2], next numeric) 
RETURNS numeric[2] AS 















































$$ 
SELECT 
CASE 
WHEN $2 IS NULL OR $2 = 0 THEN $1 
ELSE ARRAY[COALESCE($1[1],0) + ln($2), $1[2] + 1] 
END; 
$$ 


LANGUAGE sql IMMUTABLE PARALLEL SAFE; 


此 处 定义 的 状态 切换 函数 有 两 个 输入 项 : 第 一 个 是 前 次 调用 本 状态 切换 函数 计算 后 得 到 的 
结果 ， 其 类 型 为 含 两 个 元 素 的 数字 型 数组 ， 第 二 个 是 本 轮 计算 要 处 理 的 样本 值 。 如 果 第 二 
个 参数 的 值 为 NULL 或 者 为 0， 则 本 轮 无 须 计算 ， 直接 返回 参数 1 的 值 ， 否 则 将 本 次 处 理 的 
样本 数字 的 In 对 数值 累加 到 参数 数组 的 第 一 个 元 素 上 ， 并 对 参数 数组 的 第 二 个 元 素 值 加 1。 
这 样 最 终 得 到 结果 就 是 含 所 有 样本 数字 的 In 对 数值 的 总 和 以 及 总 运算 次 数 。 

此 外 还 需要 一 个 如 示例 8-6 所 示 的 最 终 处 理 函 数 ， 该 函数 中 需要 将 状态 转换 函数 计算 得 到 
的 两 个 值 相 除 。 


示例 8-6 ”创建 几何 平均 值 聚合 函数 的 最 终 处 理 国 数 
CREATE OR _ REPLACE FUNCTION geom mean_final(numeric[2]) 
RETURNS numeric AS 
$$ 
SELECT CASE WHEN $1[2] > 9 THEN exp($1[1]/$1[2]) ELSE © END; 
$$ 
LANGUAGE sql IMMUTABLE PARALLEL SAFE; 







































































最 后 ， 需 要 将 前 面 定义 的 这 些 子 函数 整合 到 一 起 ， 组 成 一 个 完整 的 聚合 函数 ， 语 法 如 示例 
8-7 所 示 。( 请 注意 ， 本 例 中 的 聚合 运算 需要 一 个 初始 值 (0,0)， 该 初始 值 的 类 型 与 SFUNC 
的 参数 类 型 一 定 是 一 致 的 。) 





示例 8-7 ”基于 定义 好 的 子 国 数 来 创建 几何 平均 值 聚 合 函 数 


接 下 来 测试 一 


CREATE AGGREGATE geom mean(numeric) ( 
SFUNC=geom_mean_state, 
STYPE=numeric[ ] ， 
FINALFUNC=geom_mean_final, 

PARALLEL = safe, 

INITCOND="' {0,0}' 

); 





多 样 性 排名 ， 并 列 出 种 族 多 样 性 最 好 的 5 个 县 的 数据 。 
示例 8-8 ”基于 儿 何平 均值 来 统计 出 种 族 多 样 性 最 好 的 


接 下 来 我 们 步子 迈 大 一 点 ， 直 接 将 上 











SELECT Left(tract_id,5) As county, geom mean(val) 
FROM census.vw_facts 


下 刚刚 创建 好 的 函数 。 在 示例 8-8 中 ， 我 们 计算 出 了 马萨诸塞 州 各 县 的 种 族 


个 二 


As div_county 


WHERE category = 'Population' AND short_name != 'white_alone' 


GROUP BY county 
ORDER BY div_county DESC LIMIT 5; 


county 


| 
" 
25025 | 85.1549046212833364 
| 
| 
| 
| 


25013 79.5972921427888918 
25017 74.7697097102419689 
25021 73.8824162064128504 
25027 73.5955049035237656 














何 ， 如 示例 8-9 所 示 。 
示例 8-9 列 出 5 个 种 族 多 样 性 最 好 的 人 口 普查 区 





WITH X AS (SELECT 
tract_id, 
left(tract_id,5) As county, 
geom mean(val) OVER (PARTITION BY tract id) As 





鲁 定 义 的 聚合 函数 当 作 窗口 函数 来 试 一 下 ， 看 效果 如 


div_tract, 


ROW_NUMBER() OVER (PARTITION BY tract id) As rn， 


geom mean(val) OVER(PARTITION BY left(tract_ id， 


5)) As div county 


FROM census.vw_facts WHERE category = 'Population' AND short name != 'white_alone' 


) 


SELECT tract id, county, div tract, div_county 
FROM X 

WHERE rn = 1 

ORDER BY div_tract DESC，div_county DESC LIMIT 5; 


tract_id | county | div_tract | 

------------ +-------- +---------------------- +---- 
25025160101 | 25025 | 302.6815688785928786 | 85. 
25027731900 | 25027 | 265.6136902148147729 | 73 
25021416200 | 25021 | 261.9351057509603296 | 73 
25025130406 | 25025 | 260.3241378371627137 | 85 
25017342500 | 25017 | 257.4671462282508267 | 74 


div_county 


1549046212833364 


.5955049035237656 
.8824162064128504 
.1549046212833364 
.7697097102419689 





8.3 ”使 用 PL/pgSQL 语 言 编 写 函 数 


如 果 SQL 语言 已 经 不 能 满足 你 编写 函数 的 需求 ， 一 般 来 说 常见 的 解决 方案 是 转 为 使 用 PL/ 
pgSQL。PL/pgSQL 优 于 SQL 的 地 方 在 于 ， 它 支持 通过 DECLARE 语法 定义 本 地 变量 以 及 支 
持 流 程控 制 语法 。 


8.3.1 编写 基础 的 PL/pgSQL 函 数 


为 了 展示 PL/pgSQL 与 SQL 的 语法 区 别 ， 我 们 在 示例 8-10 中 用 PL/pgSQL 重 写 了 示例 8-4 
中 的 函数 例子 。 


示例 8-10 使 用 PL/pgSQL 编写 返回 值 为 表 类 型 的 函数 
CREATE FUNCTION select logs_rt(param user_name varchar) 
RETURNS TABLE (log_id int, user_name varchar(50), 
description text, log_ts timestamptz) AS 














$$ 
BEGIN 
RETURN QUERY 
SELECT log_id, user_name, description, log_ts FROM Logs 
WHERE User_name = param_User_name; 
END; 
$$ 


LANGUAGE 'plpgsql' STABLE; 


8.3.2 ”使 用 PL/pgSQL 编 写 触发 器 函数 


由 于 PostgreSQL 不 支持 使 用 SQL 编写 触发 器 函数 ， 因 此 PL/pgSQL 就 成 了 编写 触发 器 函 
数 的 首选 。 本 节 将 介绍 如 何 使 用 PL/pgSQL 编写 基本 的 触发 器 函数 。 

总 共 需 要 两 个 步骤 : 第 一 步 是 写 一 个 触发 器 函数 ， 第 二 步 是 将 此 触发 器 函数 显 式 附加 到 合适 
的 触发 器 上 。 第 二 步 将 处 理 触 发 器 的 函数 与 触发 器 本 身分 离开 ， 这 是 PostgreSQL 的 一 个 强 
大 的 功能 。 你 可 以 将 同一 个 触发 器 函数 附加 到 多 个 触发 器 上 ， 从 而 实现 触发 器 函数 逻辑 的 重 
用 。 该 模式 是 PostgreSQL 的 独创 功能 ， 没 有 任何 别 的 数据 库 支 持 该 特性 。 由 于 触发 器 函数 
之 间 是 完全 独立 的 ， 你 可 以 为 每 个 触发 器 函数 选择 不 同 的 编程 语言 ， 这 些 不 同 语言 编写 的 触 
发 器 完全 可 以 协同 工作 。PostgreSQL 支持 通过 一 个 触发 事件 (INSERT、UPDATE、DELETE) 激 
活 多 个 触发 器 ， 而 且 每 个 触发 器 可 以 基于 不 同 的 语言 编写 。 例 如 ， 假 设 数 据 库 中 发 生 某 一 事 
件 时 你 需要 将 其 记录 下 来 ， 另 外 还 需要 发 邮件 通知 你 。 那 么 你 可 以 使 用 PL/PythonU 或 者 PL/ 
PerlU 语言 编写 一 个 具备 发 送 邮件 功能 的 触发 器 ， 同 时 可 以 使 用 PL/pgSQL 语言 编写 一 个 记 
录 日 志 的 触发 器 。 发 生 指 定 事 件 时 ， 这 两 个 触发 器 会 同时 被 触发 ， 执 行 各 自 的 任务 。 

示例 8-11 中 演示 了 如 何 创建 一 个 基本 的 触发 器 函数 及 配套 的 触发 器 。 

示例 8-11 通过 触发 器 对 新 插入 的 记录 或 者 修改 的 记录 打 时 间 惟 


CREATE OR _ REPLACE FUNCTION trig_time_stamper() RETURNS trigger AS © 
$$ 
BEGIN 

NEW.upd_ts := CURRENT_TIMESTAMP; 

RETURN NEW; 




































































END 
$$ 
LANGUAGE plpgsql VOLATILE; 


CREATE TRIGGER trig_1 

BEFORE INSERT OR UPDATE OF session_state, session id @ 
ON web_sessions 

FOR EACH ROW EXECUTE PROCEDURE trig time stamper(); 


@ 定义 触发 器 函数 。 该 函数 适用 于 任何 带 有 upd_ts 字段 的 表 。 该 函数 会 先 将 upd_ts 字段 
的 值 更 新 为 当前 时 间 惟 ， 然 后 再 返回 修改 后 的 记录 。 

四 “字段 级 触发 ”是 9.0 版 开始 支持 的 一 个 特性 ， 通 过 该 特性 可 以 将 触发 器 的 触发 时 机 精 
确 到 字段 级 别 。 在 9.0 版 之 前 ， 只 要 发 生 了 UPDATE 或 者 INSERT 动作 ， 上 面 示例 中 的 触 
发 器 都 会 被 触发 。 因 此 ， 如 果 要 实现 字段 级 触发 控制 ， 就 必须 拿 0LD.some_column 和 
NEN.some_coLumn 进行 对 比 ， 找 到 发 生变 化 的 字段 ， 然 后 才能 判定 是 否 要 进行 “字段 级 
触发 ”。( 请 注意 : INSTEAD OF 触发 器 不 支持 该 特性 。) 


8.4 使 用 PL/Python 语 言 编 写 函 数 


Python 是 一 种 非常 灵活 的 语言 ， 它 支持 非常 丰富 的 功能 扩展 库 。 据 我 们 所 知 ，PostgreSQL 
是 唯一 一 种 允许 用 户 使 用 Python 语言 来 编写 函数 的 数据 库 。 从 9.0 版 开始 ，PostgreSQL 还 
同时 支持 了 Python 2 和 Python 3 两 种 语言 。 



































你 可 以 在 同一 个 database 中 同时 安装 PL/Python2U 和 PL/Python3U 这 两 个 语 
言 包 ,但 在 同一 个 用 户 会 话 上 不 能 同时 使 用 这 两 种 语言 。 这 就 意味 着 你 不 能 
在 同一 个 语句 中 同时 调用 分 别 由 PL/Python2U 和 PL/Python3U 编写 的 函数 。 
你 在 系统 中 会 见 到 一 种 叫 作 PL/PythonU 的 语言 ， 它 实际 上 是 系统 为 了 保持 
前 向 兼容 而 为 PL/Python2U 语言 创建 的 一 个 别名 。 























在 使 用 PL/Python 语言 之 前 ， 要 先 在 服务 器 上 搭建 好 Python 运行 环境 。 Windows 和 Mac 
平台 的 Python 安装 包 可 以 从 http:/www.python.org/download/ 站 点 下 载 。Linux/Unix 平台 
的 各 种 发 行 版 上 一 般 都 已 经 附带 了 Python 环境 ， 因 此 无 须 额外 安装 。 请 参考 PostgreSQL 
官方 手册 中 对 PL/Python 的 相关 介绍 来 了 解 详情 。 搭 建 好 Python 运行 环境 之 后 ， 需 要 为 
PostgreSQL 安装 Python 语言 扩展 包 。 


CREATE EXTENSION plpython2u; 
CREATE EXTENSION plpython3u; 


在 PostgreSQL 上 安装 Python 语言 扩展 包 之 前 ， 务 必 确 保 服 务 器 操作 系统 上 的 Python 运行 
环境 已 经 正常 ， 否 则 你 可 能 会 遇 到 各 种 奇 奇 怪 怪 的 问题 。 

由 于 PostgreSQL 的 PL/PythonU 语言 扩展 包 是 基于 某 个 具体 版 本 的 Python 语言 包 编 译 出 来 
的 ， 因 此 你 需要 保证 服务 器 上 的 Python 版 本 与 pLpythonu 扩展 包 的 版 本 是 匹配 的 。 例 如 ， 
假设 你 的 plpython2u 扩展 包 是 基于 Python 2.7 编译 的 ， 那 么 服务 器 上 就 需要 安装 好 Python 
2.7 运行 环境 。 
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编写 基本 的 Python 函数 

PostgreSQL 会 自动 在 PostgreSQL 数据 类 型 与 Python 数据 类 型 间 进行 双向 转换 。PL/Python 
语言 编写 的 国 数 支持 返回 数组 和 复合 数据 类 型 。 你 可 以 使 用 PL/Python 来 编写 触发 器 函数 
和 聚合 国 数 。 我 们 在 PostgresOnline 站 点 上 提供 了 一 系列 介绍 PL/Python 的 文章 ， 其 中 有 相 
关 的 语法 示例 。 


Python 语言 可 以 实现 一 些 通 过 PL/pgSQL 语言 无 法 实现 的 功能 。 示 例 8-12 中 演示 了 如 何 使 
用 PL/Python 语言 来 编写 一 个 文本 搜索 函数 ， 该 函数 可 以 实现 对 PostgreSQL 在 线 官方 手册 
的 内 容 进行 检索 。 


示例 8-12 使 用 PL/Python 语言 编写 的 函数 来 搜索 PostgreSQL 官方 手册 的 内 容 
CREATE OR REPLACE FUNCTION postgresql_help_search(param_search text) 
RETURNS text AS 
$$ 
import urllib, re @ 
response = urllib.urlopen( 
'http://www.postgresql.org/search/?u=%2Fdocs%2Fcurrent%2F&q=' + param_search 















































raw_html = response.read() © 

result = 
raw_html[raw_html.find("<!-- docbot goes here -->") : 
raw_html.find("<!-- pgContentWrap -->") - 1] @ 

result = re.sub('<[^<]+?>', '', result).strip() © 

return result @ 

$$ 

LANGUAGE plpython2yu SECURITY DEFINER STABLE; 


@ 导入 接 下 来 需要 使 用 的 功能 库 。 

@ 在 连接 搜索 词 之 后 执行 搜索 。 

@ 读 取 返回 的 搜索 结果 并 将 其 保存 到 一 个 名 为 raw_htmt 的 变量 

@ 从 raw_html 中 将 <!-- docbot goes here -> 和 <!-- pgContentWrap --> 之 间 包 含 的 内 
容 截 取出 来 ， 并 存放 到 一 个 名 为 result 的 新 变量 

日 将 result 开头 和 结尾 的 HTML 标记 和 空格 删除 。 

@ 返回 result 变量 的 内 容 。 


调用 Python 函数 与 调用 别 的 语言 编写 的 函数 没什么 两 样 。 在 示例 8-13 中 ， 我 们 使 用 在 示 
例 8-12 中 创建 的 函数 来 搜索 三 个 字符 


示例 8-13 在 查询 语句 中 使 用 Python 函数 
SELECT search_term，Left(postgresqL_heLp_search(search_term) ,125) As result 
FROM (VALUES ('regexp_match'),('pg_trgm'),('tsvector')) As x(search_ term); 


前 面 提 到 过 ，PL/Python 是 一 种 非 受信 语言 ， 而 且 没 有 相应 的 受信 版 本 。 这 意味 着 只 有 超 
级 用 户 才 能 使 用 PL/Python 编写 函数 ， 并 且 使 用 该 语言 编写 出 来 的 函数 可 以 直接 操作 文件 
系统 。 示 例 8-14 就 利用 了 PL/Python 的 这 种 能 力 来 获得 一 个 目录 中 的 文件 列表 。 请 注意 ， 
从 操作 系统 的 角度 来 看 ，PL/Python 函数 是 以 PostgreSQL 安装 时 创建 的 postgres 操作 系统 
账户 身份 来 执行 的 ， 因 此 你 在 执行 该 示例 之 前 需要 确保 postgres 账户 对 该 示例 中 使 用 的 目 
录 拥 有 访问 权限 。 
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示例 8-14 列 出 一 个 目录 中 的 所 有 文件 
CREATE OR REPLACE FUNCTION list incoming files() 
RETURNS SETOF text AS 
$$ 
import os 
return os.listdir('/incoming') 
$$ 
LANGUAGE 'plpython2y' VOLATILE SECURITY DEFINER; 


可 以 通过 以 下 语句 执行 上 面 创建 的 函数 。 


SELECT filename 
FROM list incoming files() As filename 
WHERE filename ILIKE '%.csv' 


8.5 ”使 用 PL/V8、PL/CoffeeScript 以 及 PL/ 
LiveScript 语 言 来 编写 函数 


PL/V8 (又 名 PL/JavaScript) 是 一 种 基于 Google V8 引擎 的 受信 语言 。 通 过 它 可 以 用 
JavaScript 来 编写 国 数 ， 并 使 用 JSON 数据 类 型 来 与 外 界 交 互 。PL/V8 并 不 是 PostgreSQL 
的 一 个 核心 功能 ， 因 此 在 比较 流行 的 PostgreSQL 发 行 版 中 都 不 附带 此 语言 包 。 你 可 以 
通过 源码 自行 编译 安装 。 我 们 已 经 为 你 提供 了 编译 好 的 Windows 平台 安装 包 。 你 可 以 从 
PostgresOnline 站 点 下 载 到 PostgreSQL 9.6 版 本 的 PL/V8 安装 包 ( 含 32 位 和 64 位 版 本 )。 
在 PostgreSQL 中 安装 了 PL/V8 扩展 包 后 ， 你 会 发 现 新 增 支持 的 语言 不 是 一 种 ， 而 是 三 种 ， 
不 过 它们 都 是 JavaScript 的 相关 语言 。 
PLMV8 (plv8) 
这 是 最 基本 的 JavaScript 语言 ， 也 是 下 面 两 种 语言 的 基础 。 
PL/CoffeeScript (plcoffee) 
CoffeeScript 是 一 门 简洁 的 、 构 架 于 JavaScript 之 上 的 预 处 理 器 语言 ， 可 以 静态 编译 成 
JavaScript。 其 语法 类 似 于 Python， 也 使 用 了 缩 进 格式 来 表达 代码 段 之 间 的 隶属 关系 ， 
从 而 省 掉 了 烦人 的 大 括号 。 
PL/LiveScript (plls) 
LiveScript 是 CoffeeScript 语言 的 一 个 分 支 ， 其 语法 与 CoffeeScript 类 似 ， 但 拥有 更 多 的 
语法 特性 。“CoffeeScript: 10 Reasons to Switch from CoffeeScript to LiveScript” 这 篇 文章 
中 认为 LiveScript 是 CoffeeScript 的 理想 替代 上 品 。 相 比 CoffeeScript，LiveScript 拥有 更 
多 类 似 于 Python、F# 和 Haskell 的 特性 。 如 果 你 正在 寻找 一 门 比 PL/Python 占用 内 存 空 
间 更 小 的 受信 语言 ， 那 么 应 该 试 试 LiveScript。 
PL/CoffeeScript 和 PL/LiveScript 语言 都 是 基于 相同 版 本 的 PL/V8 库 编 译 的 ， 因 此 二 者 的 功 
能 本 质 上 与 PL/V8 完全 一 致 。 事 实 上 ， 如 果 这 两 种 语言 你 试用 之 后 觉得 不 合适 ， 那 么 也 可 
以 很 轻易 地 切换 回 PL/V8。 这 三 种 语言 都 是 受信 语言 ， 这 意味 着 它们 无 法 访问 底层 文件 系 
统 ， 但 没有 超级 用 户 权 限 的 用 户 可 以 用 它们 来 实现 函数 。 
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示例 8-15 中 是 创建 这 三 个 语言 包 的 命令 。 如 果 你 需要 在 某 个 database 中 使 用 这 些 语言 ， 那 
么 就 必须 在 其 中 执行 一 遍 这 些 安装 命令 。 这 三 种 语言 可 以 单独 按 需 安装 。 
示例 8-15 ”PL/V8 系列 语言 包 的 安装 

CREATE EXTENSION plv8; 


CREATE EXTENSION plcoffee; 
CREATE EXTENSION plls; 


与 PL/pgSQL 相 比 ， 上 述 的 PL/V8 系列 语言 能 够 提供 很 多 关键 的 功能 特性 ， 这 使 得 它们 有 

着 独特 的 存在 价值 。 这 些 特 性 中 的 一 部 分 只 有 PL/R 这 种 高 端 过 程式 语言 才 支 持 。 

。 与 SQL 和 PL/pgSQL 相 比 ， 数 学 运算 速度 更 快 。 

。 创建 窗口 函数 的 能 力 。SQL、PL/pgSQL、PL/Python 均 不 支持 该 能 力 (但 PL/R 和 C 语 
言 是 支持 的 )。 

。 创建 触发 器 函数 和 聚合 函数 的 能 

。 支持 语句 预 解析 、 子 事务 、 内 骨 函 数 、 类 以 及 try-catch 异常 处 理 机 制 。 

。 使 用 eval 函数 动态 执行 JavaScript 代码 的 能 

。 支持 JSON 数据 类 型 ， 能 对 JSON 对 象 进行 循环 筛选 处 理 。 

。 在 D0 命令 的 匿名 代码 块 中 访问 函数 的 能 

。 兼容 Node.js。PL/V8 和 Node.js 均 使 用 了 谷歌 V8 引擎 ， 因 此 很 多 适用 于 Nodejjs 的 库 
可 以 不 经 修改 就 直接 应 用 于 PL/V8。 这 给 Node.js 开发 人 员 以 及 其 他 使 用 JavaScript 进 
行 网 络 应 用 开发 的 人 们 带 来 了 很 多 便利 。PostgreSQL 中 有 一 个 名 为 plv8x 的 扩展 包 ， 它 
使 得 Node.js 的 库 在 PL/V8 中 重用 起 来 更 加 容易 。 


PostgresOnline 博客 站 点 上 提供 了 一 些 介绍 PL/V8 用 法 的 例子 。 在 有 的 例子 里 ， 我 们 从 网 
上 找 来 了 大 块 的 JavaScript 代码 并 修改 移植 为 PL/V8 语言 ， 详 情 可 参考 “Using PLV8 to 
Build JSON Selectors” 这 篇 博文 。 前 述 PL/V8 系列 语言 可 完美 地 辅助 Web 应 用 开发 ， 因 为 
大 量 的 客户 端 JavaScript 代码 都 是 可 以 直接 拿 来 重用 的 。 不 过 ， 对 于 PostgreSQL 来 说 ， 这 
几 种 语言 更 为 重要 的 意义 在 于 它们 都 是 全 功能 的 强大 语言 ， 可 用 于 处 理 数值 计算 、 数 据 修 
改 以 及 很 多 其 他 任务 。 


8.5.1 编写 基本 的 函数 


PL/V8 语言 的 主要 优点 之 一 就 是 可 以 在 PL/V8 函数 中 直接 调用 任何 JavaScript 国 数 ， 而 且 
几乎 不 需要 做 修改 。 例 如 ， 网 上 有 很 多 对 电子 邮件 地 址 进行 合法 性 验证 的 JavaScript 函数 ， 
我 们 随便 找 了 一 个 并 将 其 封装 为 PL/V8 函数 ， 如 示例 8-16 所 示 。 


示例 8-16 使 用 PL/V8 函数 来 验证 电子 邮件 地 址 的 合法 性 
CREATE OR REPLACE FUNCTION 
validate email(email text) returns boolean as 
$$ 
var re = /\S+@\S+\.\S+/; 
return re.test(email); 
$$ LANGUAGE plv8 IMMUTABLE STRICT PARALLEL SAFE; 


上 面 的 例子 中 使 用 了 一 个 JavaScript 正则 表达 式 对 象 来 检查 电子 邮件 地 址 的 合法 性 。 示 例 
8-17 中 演示 了 如 何 使 用 此 函数 。 






























































示例 8-17 调用 PL/V8 语言 编写 的 电子 邮件 地 址 合法 性 校 验 函 数 
SELECT email, validate email(email) AS is valid 
FROM (VALUES ('alexgomezq@gmail.com') 
,('alexgomezqgmail.com'),('alexgomezq@gmailcom')) AS x (email); 


输出 结果 如 下 : 
email | is_valid 
i ee 
alexgomezq@gmail.com | 七 
alexgomezqgmail.com |f 
alexgomezq@gmailcom |f 








虽然 可 以 使 用 PL/pgSQL 语言 以 及 PostgreSQL 自己 的 正则 表达 式 功 能 来 实现 与 上 例 中 完全 
相同 的 验证 功能 ， 但 我 们 刚刚 还 是 光明 正大 地 拿 来 了 一 段 别人 的 成 熟 代码 ， 然 后 没 花 任 何 
时 间 就 实现 了 预期 的 功能 。 对 开发 人 员 来 说 ， 这 难道 不 是 最 理想 的 人 生体 验 吗 ? 如 果 你 是 
一 名 Web 开发 人 员 ， 而 且 需 要 在 客户 端 和 数据 库 服 务 器 端 同 时 对 某 份 数据 进行 逻辑 完全 相 
同 的 合法 性 验证 ， 那 么 使 用 PL/V8 可 以 使 你 的 工作 事半功倍 ， 只 要 在 客户 端 写 好 逻辑 ， 然 
后 复制 粘贴 到 数据 库 端 就 可 以 了 。 


你 可 以 创建 一 张 带 一 个 text 字段 的 表 (该 text 字段 用 于 存储 JavaScript 函数 )， 然 后 将 这 
些 校 验 函 数 都 存 入 该 表 。 然 后 通过 一 些 设置 ， 可 以 实现 PostgreSQL 启动 时 自动 加 载 表 中 
存储 的 这 些 函 数 ， 此 后 在 数据 库 的 任何 PL/V8 函数 中 都 可 以 随便 调用 这 些 函 数 了 。 具 体 
的 操作 步骤 请 参考 Andrew Dunstan 的 博文 “Loading Useful Modules in PLV8”。 能 够 实现 
JavaScript 函数 自动 加 载 的 关键 在 于 ，PL/V8 原生 支持 了 eval 函数 ， 通 过 该 函数 可 以 动态 
执行 任何 JavaScript 命令 ， 因 此 才 得 以 在 启动 阶段 就 对 函数 进行 预 加 载 。 

我 们 通过 一 个 在 线 语法 转换 器 (js2coffee.org) 将 示例 8-17 中 的 JavaScript 函数 转换 成 了 基 
于 CoffeeScript 语法 的 国 数 ， 如 示例 8-18 所 示 。 


示例 8-18 使 用 PL/Coffee 语言 编写 的 电子 邮件 地 址 校 验 函数 
CREATE OR REPLACE FUNCTION 
validate email(email text) returns boolean as 


$$ 







































































re = /\S+@\S+\.\S+/ 
return re.test email 
$$ 
LANGUAGE plcoffee IMMUTABLE STRICT PARALLEL SAFE; 


CoffeeScript 与 JavaScript 之 间 的 语法 差别 并 不 大 ， 主 要 的 变化 是 去 掉 了 小 括号 、 大 括号 和 
分 号 。LiveScript 的 语法 和 CoffeeScript 的 语法 几乎 完全 一 样 ， 唯 一 的 差别 就 是 语言 声明 要 
改 为 LANGUAGE plls。 


8.5.2 ”使 用 PL/V8 来 编号 聚合 函数 


在 示例 8-19 和 示例 8-20 中 ， 我 们 使 用 PL/V8 语言 重 写 了 计算 几何 平均 值 的 聚合 函数 所 使 
用 的 状态 切换 函数 和 最 终 处 理 函 数 〈 原 例子 请 参考 8.2.2 市 )。 









































示例 8-19 ”PL/V8 版 的 儿 何平 均值 聚合 函数 的 状态 切换 函数 
CREATE OR REPLACE FUNCTION geom mean_state(prev numeric[2], next numeric) 
RETURNS numeric[2] AS 
$$ 
return (next == null || next== 0) ? prev : 
[(prev[0] == nuLL)? 0: prev[0] + Math.log(next), prev[1] + 1]; 
$$ 
LANGUAGE plv8 IMMUTABLE PARALLEL SAFE; 


示例 8-20 ”PL/V8 版 的 几何 平均 值 聚 合 函 数 的 最 终 处 理 函 数 
CREATE OR REPLACE FUNCTION geom mean_final(in_num numeric[2]) 
RETURNS numeric AS 
$$ 
return in_num[1] > 0 ? Math.exp(in num[0]/in_num[1]) : 0; 
$$ 
LANGUAGE plv8 IMMUTABLE PARALLEL SAFE; 
最 后 ，CREATE AGGREGATE 命令 将 各 子 函 数 整 合成 我 们 想 要 的 聚合 函数 。 不 管子 函数 采用 什 
么 语言 编写 ， 此 处 的 语法 都 是 一 样 的 ， 具体 如 示例 8-21 所 示 。 
示例 8-21 PL/V8 版 的 几何 平均 值 聚合 国 数 的 最 终 定 义 
CREATE AGGREGATE geom mean(numeric) ( 
SFUNC=geom_mean_state, 
STYPE=numeric[], 
FINALFUNC=geom_mean_final, 
PARALLEL = safe, 
INITCOND="' {0,0}" 
); 
你 可 以 再 运行 一 遍 示 例 8-9， 但 把 其 中 的 geom_mean 函数 换 为 此 处 的 PL/V8 版 本 。 得 到 的 
结果 与 当初 使 用 SQL 版 本 geom_mean 计算 得 到 的 结果 肯定 是 一 样 的 ， 但 PL/V8 版 本 的 运 
算 速 度 比 SQL 版 本 要 快 两 到 三 倍 。 对 于 数学 运算 来 说 ， 你 会 发 现在 很 多 情况 下 ， 用 PL/V8 
语言 编写 的 函数 要 比 用 SQL 编写 的 功能 相同 的 函数 快 10 到 20 倍 。 


8.5.3 ”使 用 PL/V8 编 写 窗口 函数 


PostgreSQL 有 很 多 内 置 的 窗口 函数 ，7.3 节 中 已 讨论 过 。 任 何 一 个 聚合 函数 ， 包 括 用 户 自 定义 
的 聚合 函数 ， 都 可 以 用 作 窗 口 聚 合 函 数 。 仅 这 两 个 功能 点 已 足以 使 PostgreSQL 在 所 有 的 关系 
型 数据 库 中 脱颖而出 。 更 加 令 人 印象 深刻 的 是 ，PostgreSQL 还 支持 用 户 自 定义 窗口 函数 。 


不 过 请 注意 ，PostgreSQL 所 支持 的 大 多 数 过 程式 语言 都 不 能 用 于 创建 窗口 函数 。 不 管 是 内 
置 的 PL/pgSQL 还 是 SQL， 抑 或 是 PL/Python 和 PL/Perl 都 不 支持 该 特性 。C 语言 可 以 ， 但 
需要 编译 ， 这 很 麻烦 。PL/R 部 分 支持 该 特性 ， 但 PL/V8 不 但 完全 支持 创建 自 定义 窗口 函 
数 ， 而 且 速 度 还 很 快 (在 很 多 情况 下 速度 与 用 C 编写 是 一 样 的 ) ， 另 外 它 还 不 需要 像 C 一 
样 对 函数 代码 编译 后 才能 用 。 

PL/V8 语言 支持 一 个 名 为 plv8.window_object 的 函数 ， 该 函数 可 以 返回 当前 窗口 对 象 的 一 
个 句柄 ， 通 过 该 句柄 可 以 对 窗口 内 的 元 素 进 行 检视 和 访问 。 正 是 由 于 该 特性 的 存在 ，PL/V8 
才 可 以 支持 创建 自 定义 窗口 函数 。 





















































在 示例 8-22 中 ， 我 们 创建 了 一 个 窗口 函数 ， 其 功能 是 对 于 表 中 每 一 行 ， 判 定 它 是 否 是 一 批 
“连续 值 记 录 ” 中 的 首 记 录 ， 如 果 是 就 返回 tue， 否 则 返回 false。 此 处 ,“ 连 续 值 记录 ”的 
判定 标准 是 从 该 记录 开始 连续 N 条 记录 的 特定 字段 值 都 相同 。 该 函数 可 以 让 用 户 自行 设 定 
连续 多 少 条 记录 值 相同 就 算是 “连续 值 记录 ”，ofs 参数 用 于 设 定 该 值 。 


示例 8-22 用 PL/V8 创建 的 窗口 函数 来 标记 重复 记录 值 
CREATE FUNCTION run_begin(arg anyelement, ofs int) RETURNS boolean AS $$ 
var winobj = plv8.get window object(); 
var result = true; 
/** 获取 当前 值 **/ 
var cval = winobj.get func arg_in partition(0, 
0 









































winobj.SEEK_CURRENT, 
false); 
for (i = 1; i < ofs; i++){ 
/xx 获取 下 一 个 值 **/ 
nval = Winobj.get_func_arg_in_partition(0， 
ls, 
winobj.SEEK_CURRENT, 
false); 
result = (cval == nval) ? true : false; 
if (!result){ 
break; 


} 
/** 下 一 个 当前 值 是 最 后 一 个 值 **/ 


cval = nval; 


} 


return result; 
$$ LANGUAGE plv8 WINDOW; 


要 将 一 个 函数 定义 为 窗口 函数 ， 必 须 在 其 末尾 行 加 上 WINDOWs 标记 符 ， 如 示例 8-22 所 示 。 
在 函数 的 主体 逻辑 中 ， 必 须要 遍历 访问 窗口 中 的 每 条 记录 并 对 其 进行 计算 和 判定 。 如 前 所 
述 ，PL/V8 支持 通过 窗口 句柄 来 实现 这 一 功能 ， 该 句柄 支持 的 所 有 API 可 在 PL/V8 官方 手 
册 的 “PL/V8 窗口 函数 API” 一 市 中 查 到 。 我 们 在 上 面 所 编写 的 函数 中 会 透 过 窗口 查看 当 
前 记录 的 后 ofs 条 记录 的 值 。 如 果 后 ofs 条 记录 的 值 与 当前 记录 的 值 都 一 样 ， 则 说 明 当 前 
记录 是 一 批 “ 连 续 值 记录 ”的 首 记 录 ， 窗 口 国 数 返 回 true， 否 则 返回 false。PL/V8 提供 了 
get_func_arg_in_partiton 国 数 以 扫描 窗口 中 的 记录 。 我 们 通过 该 函数 查看 该 记录 的 后 续 
记录 ， 当 判定 到 后 续 记 录 的 值 与 当前 记录 值 不 同 或 者 已 到 达 最 后 一 条 记录 时 ， 则 返回 false 
并 退出 。 
我 们 使 用 该 函数 来 判定 掷 硬 币 游 戏 的 赢家 。 每 个 玩家 投 四 次 硬币 ， 如 果 连 续 三 次 都 掷 出 头 
像 面 则 算 赢 ， 如 示例 8-23 所 示 。 
示例 8-23 ”PL/V8 窗口 函数 的 使 用 

SELECT id, player, toss, 

run_begin(toss,3) OVER (PARTITION BY player ORDER BY id) AS rb 


FROM coin_tosses 
ORDER BY player, id; 
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id | player | toss | rb 
----+-------- +------ +---- 
4 | alex |H | 七 
8 | alex |H | 七 
12 | alex | H | 千 
16 | alex |H | 千 
2 | Leo | T | 千 
6 | Leo | H | 千 
10 | Leo | H | 千 
14 | Leo | T | 千 
1 | regina | H | 千 
5 | regina | H | 千 
9 | regina | T | 千 
13 | regina | T | 千 
3 | sonia | 工 | 七 
7 | sonia | 工 | 七 
11 | sonia |T | f 
15 | sonia | TT | 千 
(16 rows) 





如 需 更 多 使 用 PLMV8 编写 的 函数 示例 ， 请 从 GitHub 上 的 “window regression script” 项 
目下 载 。 其 中 演示 了 如 何 使 用 PL/V8 创建 PostgreSQL 内 置 的 窗口 函数 (包括 lead、lag、 


row_number 、cume_dist、first_value、last_value 等 )。 
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我 们 在 使 用 数据 库 的 过 程 中 迟早 会 遇 到 语句 性 能 问题 ， 常 见 的 解决 方案 是 优化 SQL 语句 本 
身 的 写法 ， 辅 以 建立 合适 的 索引 以 及 更 新 规划 器 分 析 过 程 中 所 需 的 统计 信息 。 为 了 帮助 用 
户 实现 这 些 优化 动作 ，PostgreSQL 提供 了 内 置 的 执行 计划 解释 器 ， 通 过 它 可 以 展示 出 一 个 
SQL 语句 的 执行 计划 。 如 果 你 了 解 如 何 编写 正确 的 SQL 语句 、 如 何 建 立 合 适 的 索引 ， 以 
及 执行 计划 解释 器 的 帮助 ， 那 么 写 出 优秀 的 SQL 语句 并 充分 利用 硬件 的 最 大 计算 能 力 应 该 
不 是 难事 。 


9.1 通过 EXPLAIN 命 令 查 看 语句 执行 计划 


要 定位 语句 的 性 能 问题 ， 最 简单 直接 的 方法 就 是 使 用 EXPLAIN 和 EXPLAIN (ANALYZE) 命令 来 
分 析 其 执行 计划 。PostgreSQL 从 很 早 的 版 本 开始 就 已 经 支持 该 命令 ， 并 且 历 年 来 其 功能 一 
直 在 不 断 地 演进 ， 目 前 已 经 非常 成 熟 ， 可 以 展示 出 一 个 语句 的 执行 计划 方方面面 的 细节 。 
在 演进 过 程 中 ， 该 命令 支持 的 输出 格式 也 越 来 越 丰富 。EXPLAIN 命令 甚至 支持 将 输出 转 储 
为 XML、JSON 或 者 YAML 格式 。 

对 于 普通 用 户 来 说 ， 该 功能 最 令 人 激动 的 一 次 强化 是 几 年 前 pgAdmin 引入 的 图 形 化 展示 执 
行 计 划 的 能 力 。 借 助 这 种 能 力 ， 你 只 需 仔细 观察 执行 计划 图 ， 即 可 了 解 语 名 的 瓶颈 点 在 哪 
里 ， 哪 些 表 应 该 建 索 引 ， 以 及 实际 的 执行 路 径 与 预期 的 执行 路 径 是 否 一 致 。 
























































9.1.1 EXPLAIN 选 项 


要 执行 非 图 形 化 的 EXPLAIN 分 析 ， 只 需 在 SQL 语句 前 加 上 EXPLAIN 以 及 一 些 可 选 参数 ， 然 
后 再 执行 即 可 。 


。 EXPLAIN 本 身 的 执行 效果 是 输出 执行 计划 而 并 不 执行 SQL 语句 本 身 。 
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。 加 上 ANALYZE 参数 之 后 (就 像 EXPLAIN (ANALYZE) ) 的 执行 效果 是 执行 该 SQL 语句 本 身 ， 
而 且 会 将 实际 执行 情况 与 执行 计划 进行 对 比分 析 ， 这 可 以 用 来 评估 执行 计划 的 准确 性 。 

。 在 EXPLAIN 后 增加 VERBOSE 参数 (语法 是 EXPLAIN (VERBOSE)) 将 使 得 输出 的 执行 计划 步 
又 精确 到 列 级 别 。 

。 还 有 一 个 必须 与 ANALYZE 参数 联 用 的 BUFFERS 参数 ， 其 语法 为 EXPLAIN (ANALYZE， 
BUFFERS) ， 通 过 它 可 以 显示 出 执行 计划 过 程 中 重用 缓存 数据 时 的 命中 次 数 ， 这 个 数字 越 
大 就 表示 本 次 查询 过 程 中 从 内 存 缓存 中 获取 的 记录 数 越 多 ， 这 些 数据 是 之 前 的 查询 执行 
过 程 中 缓存 下 来 的 ， 缓 存 中 已 有 的 数据 块 就 不 需要 再 从 磁盘 读 取 了 。 

完整 的 SQL 语句 执行 计划 解释 语法 是 这 样 的 : EXPLAIN (ANALYZE， VERBOSE， BUFFERS)+ 查 

询 语句 ， 执 行 后 输出 的 结果 包括 执行 时 间 、 列 的 输出 以 及 缓存 命中 次 数 等 。 


对 于 UPDATE 或 者 INSERT 这 种 DML 语句 来 说 ， 如 果 仅 希望 查看 其 通过 EXPLAIN (ANALYZE) 
得 到 的 执行 计划 而 并 不 希望 真正 执行 数据 修改 ， 可 以 把 这 个 语句 包装 成 一 个 事务 块 ， 即 语 
名 之 前 加 BEGIN， 之 后 加 ROLLBACK。 

可 以 通过 pgAdmin 这 种 图 形 化 工具 来 实现 图 形 化 的 EXPLAIN。 启 动 pgAdmin 之 后 ， 请 像 
平常 一 样 编写 好 查询 语句 ， 但 不 要 执行 它 ， 然 后 从 下 拉 菜 单 中 选择 EXPLAIN 或 者 EXPLAIN 
(ANALYZE)。 


9.1.2 ”运行 示例 以 及 输出 内 容 解 释 


我 们 找 个 例子 来 试验 一 下 。 首 先 使 用 EXPLAIN (ANALYZE) 命令 ，SQL 命令 中 使 用 的 是 示例 
4-1 和 示例 4-2 中 创建 的 表 。 


我 们 想 先 测试 语句 不 使 用 索引 的 情况 ， 因 此 先 将 表 上 的 主键 删 掉 。 


ALTER TABLE census.hisp_pop DROP CONSTRAINT IF EXISTS hisp_pop_pkey; 


删除 表 上 所 有 的 索引 后 ， 我 们 可 以 看 到 此 时 使 用 了 最 基础 的 执行 计划 ， 即 全 表 扫 描 策 略 。 
如 示例 9-1 所 示 。 


示例 9-1 使 用 EXPLAIN (ANALYZE) 查看 全 表 扫 描 的 执行 计划 
EXPLAIN (ANALYZE) 
SELECT tract_id, hispanic_or_latino 
FROM census.hisp_pop 
WHERE tract_id = '25025010103'; 


如 果 仅 使 用 EXPLAIN 命令 ， 则 输出 的 结果 是 估算 的 执行 计划 成 本 。 如 果 加 上 了 ANALYZE 参 
数 ， 即 使 用 EXPLAIN (ANALYZE) 命令 ， 则 输出 的 分 析 结 果 中 还 会 包含 实际 执行 后 得 到 的 真 
示例 9-2 是 示例 9-1 的 执行 输出 结果 。 


示例 9-2 ”EXPLAIN (ANALYZE) 的 执行 结果 
Seq Scan on hisp_pop 
(cost=0.00..33.48 rows=1 width=16) 
(actual time=0.213..0.346 rows=1 loops=1) 
Filter: ((tract id)::text = '25025010103'::text) 
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Rows Removed by Filter: 1477 
Planning time: 0.095 ms 
Execution time: 0.381 ms 


EXPLAIN 输出 的 执行 计划 会 包含 多 个 执行 步骤 。 每 一 步 都 会 有 一 个 估算 的 执行 成 本 范围 ， 
看 起 来 像 这 样 : cost=0.00..33.48， 如 示例 9-2 所 示 。 本 例 中 ， 第 一 个 数字 0.99 是 估算 的 
该 步骤 的 起 始 执行 成 本 ， 第 二 个 数字 33.84 是 估算 的 该 步骤 的 总 执行 成 本 。 起 始 执行 时 间 
点 之 前 会 执行 一 些 后 续 计 算 的 准备 动作 ， 而 读 取 数 据 、 索 引 扫 描 、 多 表 数 据 关联 整合 等 动 
作 都 是 在 起 始 执 行 时 间 点 之 后 发 生 的 。 如 果 执 行 方 式 为 全 表 扫 描 ， 那 么 其 起 始 执 行 成 本 为 
0， 因 为 这 种 场景 下 规划 器 只 是 简单 地 立即 开始 扫描 全 表 数 据 ， 没 有 什么 预备 动作 。 

请 注意 ， 估 算 的 执行 成 本 值 的 单位 并 不 是 真实 的 时 间 单位 ， 其 单位 取决 于 硬件 环境 以 及 执 
行 成 本 相关 的 参数 配置 。 因 此 ， 执 行 成 本 值 仅 具 有 相对 意义 ， 可 用 于 比较 同一 台 物 理 服务 
器 上 多 个 执行 计划 的 效率 。 规 划 器 的 任务 就 是 选 出 总 体 成 本 值 最 低 的 一 个 执行 计划 。 
因为 我 们 在 示例 9-1 中 加 入 了 ANALYZE 参数 ， 规 划 器 将 真实 地 执行 查询 语句 ， 所 以 执行 时 
间 中 还 会 包含 真正 的 执行 时 间 统 计 。 


通过 示例 9-2 中 的 执行 计划 可 以 看 到 规划 器 选择 了 全 表 扫 描 策略 ， 因 为 没有 任何 索引 可 用 。 
下 面 输出 的 Rows Removed by Filter:1477 是 扫描 过 程 中 排除 掉 的 不 符合 条 件 的 记录 数 。 


如 果 你 使 用 的 是 PostgreSQL 9.4 或 者 更 高 版 本 ，EXPLAIN 输出 的 执行 计划 中 还 提供 了 执行 
计划 分 析 时 间 和 真正 的 执行 时 间 。 执 行 计 划分 析 时 间 就 是 规划 器 分 析出 最 终 执行 计划 所 消 
耗 的 时 间 ， 执 行 时 间 是 按照 执行 计划 执行 并 得 到 最 终结 果 所 用 的 时 间 。 


我 们 把 主键 重新 建 起 来 : 


ALTER TABLE census.hisp_pop ADD CONSTRAINT hisp_pop_pkey PRIMARY KEY(tract_id); 
现在 再 次 执行 示例 9-1 的 语句 ， 得 到 的 输出 如 示例 9-3 所 示 。 
示例 9-3 使 用 了 索引 的 EXPLAIN (ANALYZE) 执行 计划 


Index Scan using idx_hisp_pop_tract id pat on hisp_pop 
(cost=0.28..8.29 rows=1 width=16) 
(actual time=0.018..0.019 rows=1 loops=1) 
Index Cond: ((tract_id)::text = '25025010103'::text) 
Planning time: 0.110 ms 
Execution time: 0.046 ms 
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此 场景 下 规划 器 判定 使 用 索引 会 比 全 表 扫 描 效 率 更 高 ， 因 此 在 执行 计划 中 使 用 了 索引 扫描 
策略 。 估 算 的 执行 时 间 从 33.48 降 为 8.29。 起 始 执 行 成 本 也 不 再 是 0， 因 为 规划 器 需要 先 
扫描 索引 ， 然 后 才能 把 命中 的 记录 从 磁盘 取出 来 (如 果 所 需 数据 已 经 存在 于 内 存 缓 存 中 ， 
也 有 可 能 是 直接 从 内 存 取 )。 你 也 可 以 看 到 规划 器 不 再 需要 扫描 1477 条 记录 ， 这 极 大 地 降 
低 了 执行 成 本 。 

对 于 如 示例 9-4 所 示 的 较 复杂 的 查询 ， 其 执行 计划 中 会 包含 更 多 的 步 又， 这 些 步骤 也 称 为 
子 执行 计划 。 每 一 个 子 执行 计划 都 有 它 自 己 的 成 本 估算 值 ， 这 些 值 会 被 累加 到 总 执行 计划 
的 成 本 估算 值 中 。 父 执行 计划 显示 时 总 是 排 在 最 前 面 ， 其 中 记录 的 成 本 估算 值 和 真实 时 间 
值 就 是 其 所 有 子 计划 相应 项 目 值 之 和 。 子 计划 在 显示 时 是 按照 其 层级 向 右 逐 级 缩 进 的 。 
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示例 9-4 带 GROUP BY 和 SUM 的 语句 的 EXPLAIN (ANALYZE) 分 析 
EXPLAIN (ANALYZE) 
SELECT Left(tract id,5) AS county_code, SUM(white alone) As w 
FROM census.hisp_pop 
WHERE tract_id BETWEEN '25025000000' AND '25025999999' 
GROUP BY county_code; 


示例 9-5 中 记录 的 是 示例 9-4 中 语句 的 执行 计划 ， 其 中 包含 分 组 和 求 和 操作 。 


示例 9-5 包含 散 列 聚 合 策略 的 EXPLAIN (ANALYZE) 分 析 结 果 
HashAggregate 
(cost=29.57..32.45 rows=192 width=16) 
(actual time=0.664..0.664 rows=1 loops=1) 
Group Key: "left"((tract id)::text, 5) 
-> Bitmap Heap Scan on hisp_pop 
(cost=10.25..28.61 rows=192 width=16) 
(actual time=0.441..0.550 rows=204 loops=1) 
Recheck Cond: 
(((tract_id)::text >= '25025000000'::text) AND 
((tract_id)::text <= '25025999999'::text)) 
Heap Blocks: exact=15 
-> Bitmap Index Scan on hisp_pop_pkey 
(cost=0.00..10.20 rows=192 width=0) 
(actual time=0.421..0.421 rows=204 loops=1) 
Index Cond: 
(((tract id)::text >= '25025000000'::text) AND 
((tract_id)::text <= '25025999999'::text)) 
Planning time: 4.835 ms 
Execution time: 0.732 ms 














示例 9-5 中 所 示 执 行 计划 的 顶层 步骤 是 一 个 散 列 聚合 操作 。 该 操作 包含 一 个 位 图 表 扫 描 子 
计划 ， 该 位 图 表 扫 描 子 计划 又 包含 了 一 个 位 图 索引 扫描 子 计划 。 在 本 例 中 ， 因 为 我 们 是 第 
一 次 执行 此 语句 ， 所 以 执行 计划 分 析 时 间 远 远 超过 了 真正 的 执行 时 间 。 但 PostgreSQL 有 执 
行 计 划 以 及 数据 缓存 功能 ， 所 以 如 果 我 们 再 次 执行 该 语句 ， 或 者 执行 一 个 可 以 共享 缓存 下 
来 的 执行 计划 的 类 似 语句 ， 那 么 执行 计划 的 分 析 时 间 就 会 大 大 减少 ， 而 且 真正 的 执行 时 间 
也 可 能 会 减少 ， 因 为 该 语句 执行 期 间 所 需 的 很 多 数据 可 能 已 经 缓存 在 内 存 中 了 。 由 于 刚刚 
提 到 的 这 些 缓存 功能 ， 我 们 第 二 次 的 运行 时 间 统 计数 据 如 下 : 

Planning time: 0.200 ms 

Execution time: 0.635 ms 


9.1.3 图 形 化 展示 执行 计划 

如 果 你 觉得 阅读 纯 文 字形 式 的 执行 计划 是 一 件 痛 苦 的 事 ， 那 么 图 9-1 中 演示 的 图 形 化 执行 
计划 (对 应 EXPLAIN (ANALYZE) 命令 行 ) 会 解除 你 的 烦恼 。 

你 只 需 将 鼠标 放 到 图 标 上 就 能 看 到 每 个 步骤 的 详细 信息 。 


在 结束 本 节 之 前 ， 我 们 要 向 你 介绍 一 个 表格 形式 的 执行 计划 展示 工具 (http://explain.depesz. 
com/) ， 该 工具 由 Hubert Lubaczewski 创建 ， 在 此 我 们 向 他 表示 感谢 。 打 开工 具 地 址 ， 然 后 将 
文本 格式 的 执行 计划 复制 过 去 ， 就 可 以 得 到 一 个 格式 化 得 非常 漂亮 的 表格 ， 如 图 9-2 所 示 。 
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hisp_pop_pkey 









之 


Aggregate 





hisp_pop 
Actual Rows 204 

Node Type Bitmap Index Scan 
Index Cond (ET >= 25025000000-:text) AND ((tract_idj::text <= 25025999999-:text)) 
Actual Startup Time 0.108 

Parallel Aware false 


Actual Total Time 0.108 

Parent Relationship Outer 

Actual Loops 1 

Index Name hisp_pop_pkey 





9-1: 图 形 化 展示 执行 计划 





STATS Did it help? Consider Supporting us 


Per node type stats 


Bitmap Heap Scan 1 0.129 ms 19.4 % 
Bitmap Index Scan 1 0.421 ms 63.4% 
HashAggregate 1 0.114 ms 17.2% 


Per table stats 


count | sum oftimes | % oftable 


hisp_pop 1 0.129 ms 19.4% 
Bitmap Heap Scan 1 0.129ms 100.0% 











图 9-2: 在 线 执行 计划 分 析 工具 














在 输出 的 HTML 表格 中 ， 你 可 以 看 到 经 过 格式 重 排 的 带 颜色 分 区 的 执行 计划 表 ， 其 中 会 以 
显眼 的 颜色 高 亮 显示 有 问题 的 部 分 ， 如 图 9-3 所 示 。 表 格 中 的 exclusive 列表 示 当 前 步骤 的 











操作 所 耗 时 间 ，inclusive 列表 示 当 前 步骤 及 其 所 有 子 步 又 的 操作 所 耗 时 间 。 





> 二 | 
# | exclusive | inclusive | rows x | rows | loops | node 


0.114 0.664 O20 1 1 中 HashAggregate (cost=29.57..32.45 rows=192 width=16) 
(actual time=0.664..0.664 rows=1 loops=1) 
Group Key: "left"((tract_id):-text, 5) 


轩 











204 4 中 Bitmap Heap Scan on hisp_pop 
(cost=10.25..28.61 rows=192 width=16) 


1 
2 
(actual time=0.441..0.550 rows=204 loops=1) 
Recheck Cond: (((tract_id):-text >= '25025000000"--text) AND 
((tract_id):-text <= '25025999999'-text)) 
Heap Blocks: exact=15 
3 


| 204 1 ~ Bitmap Index Scan on hisp_pop_pkey 
(cost=0.00..10.20 rows=192 width=0) 
(actual time=0.421..0.421 rows=204 loops=1) 


Index Cond: (((tract_id)::text >= '25025000000':text) AND 
((tract_id):-text <= '25025999999'--text)) 











9-3: 表格 式 的 执行 计划 分 析 结果 
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尽管 图 9-3 中 HIML 表格 形式 的 执行 计划 提供 的 信息 与 纯 文 本 形式 的 执行 计划 其 实 是 一 模 
一 样 的 ， 但 使 用 “彩色 编码 ”和 “分 步骤 操作 时 间 统 计 ” 这 两 个 功能 ， 用 户 可 以 更 轻松 地 
对 分 析 结 果 进 行 深 入 分 析 和 挖掘 。 黄 色 、 褐 色 以 及 红色 的 格子 是 潜在 的 性 能 瓶颈 。 

rows x 这 一 栏 表示 预 估 查询 出 的 记录 数 ，rows 栏 显示 的 是 执行 完毕 后 实际 查 出 的 记录 数 。 
上 表 中 显示 的 就 是 预 估 能 返回 192 行 记 录 ， 但 实际 仅 返 回 1 条 。 估 算 的 记录 数 不 准 ， 一 般 
是 因为 表 的 统计 信息 未 及 时 更 新 所 导致 。 所 以 经 常 性 地 对 表 进 行 分 析 操 作 是 个 好 习惯 ， 表 
的 分 析 操 作 可 以 更 新 表 上 的 统计 信息 ， 特 别 是 刚刚 对 表 进 行 过 大 规模 的 更 新 或 者 插入 操作 
后 ， 表 分 析 操 作 很 有 必要 。 


* /一 /二 一 

9.2 搜集 语句 的 执行 统计 信息 
性 能 调 优 的 第 一 步 就 是 要 确定 哪些 语句 是 性 能 瓶 开 。PostgreSQL 提供 了 一 个 名 为 pg_stat_ 
statements 的 性 能 监控 扩展 包 以 帮助 用 户 找 出 耗 时 最 长 的 语句 。 该 扩展 包 能 提供 所 有 执行 
过 的 SQL 语句 的 统计 度量 信息 ， 包 括 哪些 语句 执行 得 最 频繁 以 及 每 个 语句 的 执行 总 耗 时 
等 。 基 于 这 些 信息 我 们 可 以 知道 应 将 优化 的 重点 放 在 哪里 。 
大 多 数 PostgreSQL 版 本 都 自 带 pg_stat_statements 扩展 包 ， 但 启动 时 必须 明确 指定 预 加 
载 其 动态 库 ， 这 样 系统 才 会 局 动用 于 搜集 统计 数据 的 后 台 进 程 。 设 置 方法 如 下 所 示 。 
(1) 在 postgresql.conf 配置 文件 中 ， 将 shared_preload_libraries = " 更 改 为 shared_preload_ 

libraries = "pg_stat_statements ' 。 
(2) 在 postgresqlconf 文件 的 自 定义 选项 部 分 ,添加 以 下 几 行 。 


pg_stat_statements.max = 10000 
pg_stat_statements.track = all 




























































































(3) 重启 postgresql 服务 。 
(4) 登录 到 每 一 个 希望 进行 SQL 语句 性 能 统计 的 database 中 并 执行 语句 : CREATE EXTENSION 
pg_stat_statements; 。 


该 扩展 包 提 供 了 以 下 两 个 关键 功能 。 

。 一 个 名 为 pg_stat_statements 的 视图 ， 其 中 可 以 查询 到 当前 登录 用 户 在 各 database 中 执 
行 过 的 所 有 SQL 语句 的 统计 信息 。 

。 一 个 名 为 pg_stat_statements_reset 的 函数 ， 该 函数 可 以 将 到 目前 为 止 的 语句 执行 统计 
信息 全 部 清空 ， 不 过 只 有 超级 用 户 才 有 权限 执行 此 函数 。 

示例 9-6 中 的 语句 可 以 查 出 postgresql_book 这 个 database 中 最 耗 时 的 5 个 SQL 语句 。 
示例 9-6 ” 找 出 特定 database 中 最 耗 时 的 语句 


SELECT 
query, calls, total_ time, rows, 
100.0*shared_blks_hit/NULLIF(shared_blks_hit+shared_blks_read,0) AS hit_ percent 
FROM pg_stat_statements As s INNER JOIN pg_database As d On d.oid = s.dbid 
WHERE d.datname = 'postgresql_book' 
ORDER BY total_ time DESC LIMIT 5; 
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9.3 编写 更 好 的 SQL 语句 


最 好 也 最 简单 的 性 能 调 优 方法 就 是 学 会 编写 优秀 的 SQL 语句 。 我 们 在 大 多 数 客户 的 项 目 中 
见 过 的 SQL 语句 都 写 得 不 够 好 ， 它 们 未 能 发 挥 出 PostgreSQL 的 真正 威力 。 


写 出 的 SQL 语句 很 精 粒 一般 有 两 个 主要 原因 。 第 一 个 原因 是 很 多 人 会 宦 目 地 复 用 以 前 的 
SQL 编写 经 验 。 例 如 ， 有 人 曾经 写 过 一 个 使 用 了 左 连 接 的 SQL 语句 并 且 执 行 效果 还 不 错 ， 
那么 他 此 后 不 管 实际 情况 是 什么 样 都 一 直 使 用 左 连接 语法 ， 但 实际 上 ， 在 有 更 多 表 参 与 关 
联运 算 的 情况 下 ， 最 好 是 使 用 内 连接 。 与 其 他 很 多 编程 语言 不 一 样 ，SQL 语言 的 编写 经 验 
不 能 宵 目 地 复 用 。 

第 二 个 原因 是 人 们 对 于 最 新 的 SQL 语法 特性 一 般 无 法 及 时 跟 进 并 学 习 了 解 。 不 要 对 
PostgreSQL 新 版 本 中 引入 的 那些 新 语法 不 以 为 意 ， 它 们 可 以 简化 开发 ， 也 可 以 让 你 少 费 脑 
筋 ， 因 此 要 积极 地 学 习 并 利用 起 来 。 


要 想 编写 出 高 效 的 SQL 是 需要 很 多 练习 的 。 只 要 你 编写 的 SQL 语句 能 得 到 正确 结果 ， 那 
么 这 个 语句 就 不 能 算 错 ， 但 其 性 能 可 能 很 差 。 本 市 中 我 们 将 指出 人 们 常 犯 的 一 些 错 误 。 尽 
管 本 书 是 关于 PostgreSQL 的 ， 但 我 们 给 出 的 这 些 建议 其 实 也 适用 于 其 他 关系 型 数据 库 。 


9.3.1 在 SELECT 语句 中 滥用 子 查询 

新 手 常 犯 的 一 个 错误 就 是 容易 将 子 查询 当成 一 个 完全 独立 的 数据 集 来 使 用 。SQL 语言 有 一 
个 与 传统 的 编程 语言 很 不 一 样 的 地 方 ， 就 是 SQL 语言 中 并 没有 很 强烈 的 “ 黑 盒 ”概念 。 也 
就 是 说 ， 编 写 一 堆 互相 独立 的 子 查询 并 把 每 个 子 查询 当 作 一 个 “ 黑 盒 ” 数 据 块 来 看 待 ， 只 
要 能 得 到 最 后 结果 就 行 ， 而 不 管 其 他 ， 这 种 思路 是 错误 的 。 它 事实 上 割裂 了 子 查询 代码 块 
内 部 处 理 逻 辑 与 子 查询 代码 块 外 部 处 理 逻 辑 之 间 的 联系 ， 没 有 将 整个 SQL 语句 当成 一 个 有 
机 的 整体 来 处 理 。 从 多 个 子 查询 中 取 数 据 与 从 多 个 表 或 者 视图 中 取 数据 一 样 重要 ， 代 码 写 
得 不 好 效率 就 会 很 低 。 

示例 9-7 中 演示 了 一 个 小 用 子 查询 的 例子 ， 把 子 查询 当 黑 盒 使 用 的 思想 就 会 导致 这 种 写法 。 


示例 9-7 滥用 子 查 询 
SELECT tract_id, 
(SELECT COUNT(*) FROM census.facts As F 
WHERE F.tract id = T.tract_ id) As num facts, 
(SELECT COUNT(*) 
FROM census.lu fact types As Y 
WHERE Y.fact type _ id IN ( 
SELECT fact_type_id 
FROM census.facts F 
WHERE F.tract id = T.tract id 
) 
) As num_fact_types 
FROM census.Lu_tracts As T; 


上 面 的 SQL 语句 如 果 改 为 示例 9-8 的 写法 效率 会 更 高 。 下 面 的 写法 合并 了 多 个 SELECT 动 


作 并 使 用 了 关联 查询 机 制 ， 不 但 比 上 面 的 语句 更 简短 ， 速 度 也 更 快 。 如 果 表 的 数据 量 很 大 
或 者 硬件 性 能 较 差 ， 这 两 种 写法 之 间 的 性 能 差异 会 更 明显 。 
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示例 9-8 针对 滥用 子 查 询 的 语句 的 简化 改写 
SELECT T.tract_ id， 
COUNT(f.fact_type_id) As num_facts, 
COUNT(DISTINCT fact_type_id) As num_fact_types 
FROM census.Lu_tracts As T LEFT JOIN census.facts As F ON T.tract_id = F.tract_id 
GROUP BY T.tract_id; 


图 9-4 显示 的 是 示例 9-7 中 的 语句 的 执行 计划 ， 为 了 帮 你 解除 查看 字符 型 执行 计划 的 痛苦 ， 
我 们 选择 了 以 图 形 化 方式 展示 。 9-5 使 用 http:Wexplain.depesz.com 站 点 提供 的 工具 将 其 
执行 计划 转换 为 以 HTML 表格 方式 呈现 ， 也 可 以 提高 你 的 查看 效率 。 
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图 9-5: 滥用 子 查询 的 SQL 语句 的 执行 计划 表格 式 展示 
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9-6 显示 的 是 示例 9-8 中 简化 后 语句 的 执行 计划 ， 从 图 中 可 以 看 到 简化 了 多 少 执行 步骤 。 
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9-6: 删除 多 余子 查询 后 的 执行 计划 图 形 化 展示 


请 注意 ， 我 们 并 没有 要 求 你 完全 不 用 子 查 询 ， 只 是 建议 你 在 确 有 必要 时 才 使 用 ， 并 且 使 用 
时 应 当 注 意 考 虑 如 何 将 子 查 询 与 SQL 语句 的 主干 融合 ， 也 许 你 会 发 现 根本 不 需要 通过 子 查 
询 来 实现 你 所 需要 的 功能 。 总 之 请 牢记 : 子 查 询 不 是 独立 的 黑 盒 数据 块 ， 应 与 主语 句 通 盘 
考虑 后 再 结合 使 用 。 


9.3.2 ”尽量 避免 使 用 SELECT * 语 法 
SELECT * 经 常会 导致 性 能 浪费 ， 会 出 现 仅 仅 需 要 10 页 数据 却 查 出 1000 页 数据 这 种 情况 ， 
这 显然 会 导致 网 络 传输 负担 加 大 ， 而 且 还 会 出 现 两 个 你 可 能 意 想 不 到 的 问题 。 


第 一 个 问题 与 大 对 象 有 关 。PostgreSQL 会 使 用 TOAST (The Oversized-Attribute Storage 
Technique， 即 超大 尺寸 属性 存储 技术 ) 机 制 来 存储 二 进 制 大 对 象 以 及 超大 文本 。TOAST 
机 制 会 将 超过 主 表 存储 限制 的 数据 存储 到 一 张 辅助 表 中 ， 并 可 能 把 单个 文本 字段 拆 分 为 多 
行 存储 。 因 此 ， 读 取 超 大 字段 就 需要 从 辅助 的 TOAST 表 中 查询 出 多 条 记录 。 举 个 例子 ， 
如 果 某 表 包 含 文本 数据 ， 其 中 存储 了 一 整 部 《战争 与 和 平 》 这 么 庞大 的 内 容 ， 然 后 你 对 这 
个 表 做 了 一 个 SELECT * 操作 ， 那 么 不 难 想象 这 个 操作 会 慢 到 什么 程度 。 


第 二 个 问题 与 视图 有 关 。 我 们 定义 视图 的 时 候 一 般 做 不 到 完全 精确 地 指定 列 ， 也 就 是 说 视 
中 一 般 会 带 若 干 可 能 不 需要 的 列 。PostgreSQL 的 视图 定义 功能 是 很 强大 的 ， 你 可 以 使 用 
SELECT * 语句 来 定义 视图 ， 系 统 会 自动 将 星 号 替换 为 目的 表 的 完整 字段 列表 ， 你 也 可 以 在 
视图 定义 语句 中 包含 复杂 运算 表达 式 以 及 关联 查询 。 这 些 创建 视图 的 语句 都 是 合法 的 ， 没 
有 任何 问题 ， 但 用 户 访问 时 就 麻烦 了 ， 一 旦 对 这 种 复杂 视图 执行 SELECT * 查询 ， 那 么 视 医 
定义 中 所 有 的 复杂 列 都 会 经 历 漫 长 的 运算 过 程 ， 总 体 查 询 速度 会 很 慢 。 
为 了 解释 清楚 以 上 观点 ， 下 面 以 示例 9-7 中 带子 查询 的 语句 为 基础 创建 一 个 视图 ， 使 用 的 
基 表 是 census 中 的 表 。 


CREATE OR REPLACE VIEW vw_stats AS 
SELECT tract_id, 
(SELECT COUNT(*) 
FROM census.facts As F 
WHERE F.tract id = T.tract id) As num_facts ， 
(SELECT COUNT(*) 
FROM census.lu fact types As Y 
WHERE Y.fact_type_id IN ( 
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SELECT fact_type_id 
FROM census .facts F 
WHERE F.tract id = T.tract_id 
) 
) As num_fact_types 
FROM census.Lu_tracts As T; 


现在 我 们 针对 此 视图 执行 以 下 语句 : 


SELECT tract_id FROM vw_stats; 


在 我 们 的 测试 环境 中 该 语句 的 执行 大 约 耗 时 21 毫秒， 速度 很 快 ， 因 为 该 语句 没有 访问 
num_facts 和 num_fact_type 这 两 个 视图 字段 ， 这 两 个 字段 需要 经 过 复杂 的 运算 才能 得 到 结 

果 。 你 查看 一 下 该 语句 的 执行 结果 就 可 以 发 现 ， 其 中 没有 任何 一 个 步骤 会 访问 facts 表 ， 
因为 规划 器 分 析 该 语句 后 知道 根本 不 需要 访问 此 表 。 但 如 果 我 们 使 用 下 面 的 语句 来 访问 上 
述 视 图 : 


SELECT * FROM vw_stats; 


在 我 们 的 环境 中 执行 时 间 将 碳 升 到 681 毫秒 ， 其 执行 计划 如 图 9-4 所 示 。 这 里 前 后 两 个 语 
名 的 性 能 差别 是 毫秒 级 ， 但 如 果 表 的 记录 数 增加 到 千 万 级 ， 列 数 增加 到 数 百 个 ， 那 么 这 两 
个 语句 的 性 能 差异 就 非常 大 了 。 按 照 前 一 种 写法 ， | 你 可 以 搞定 后 准点 
下 班 ， 按 照 后 一 种 写法 ， 你 就 得 待 在 办 公 室 加 班 来 等 这 个 查询 执行 完毕 。 


















































9.3.3 ” 善 用 CASE 语 法 


CASE 是 ANSI SQL 标准 语法 ， 其 功能 很 强大 ， 但 利用 它 的 人 却 很 少 ， 我 们 对 此 感到 很 惊 
证。 在 很 多 需要 聚合 运算 的 场景 中 ， 使 用 CASE 语法 能 够 有 效 禁 代 子 查询 。 接 下 来 我 们 使 用 
两 个 例子 来 演示 这 一 点 ， 一 个 使 用 CASE， 一 个 使 用 子 查 询 ， 然 后 比较 二 者 的 执行 计划 和 性 
能 差异 。 示 例 9-9 使 用 了 子 查 询 语法 。 


示例 9-9 使 用 子 查 询 而 非 CASE 
SELECT T.tract_id, COUNT(*) As tot，type_1.tot AS type_1 
FROM 
Census.Lu_tracts AS T LEFT JOIN 
(SELECT tract_id, COUNT(*) As tot 
FROM census .facts 
WHERE fact_type_id = 131 
GROUP BY tract_id 
) As type_1 ON T.tract id = type_1.tract id LEFT JOIN 
census.facts AS F ON T.tract id = F.tract id 
GROUP BY T.tract_id, type_1.tot; 


图 9-7 是 示例 9-9 的 执行 计划 图 示 。 
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9-7: 使 用 子 查询 而 非 CASE 的 执行 计划 


然后 我 们 使 用 CASE 语法 改写 这 个 查询 。 你 会 发 现 优化 后 的 查询 效率 更 高 ， 也 更 容易 理解 ， 
如 示例 9-10 所 示 。 
示例 9-10 ”使 用 CASE 语法 替代 子 查 询 


SELECT T.tract_id, COUNT(*) As tot， 
COUNT(CASE WHEN F.fact_type_id = 131 THEN 1 ELSE NULL END) AS type_1 
FROM census.Lu_tracts AS T LEFT JOIN census.facts AS F 
ON T.tract id = F.tract_id 
GROUP BY T.tract_id; 


9-8 是 示例 9-10 中 语句 的 执行 计划 图 示 。 
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9-8: 使 用 CASE 代替 子 查询 后 的 执行 计划 











尽管 优化 后 的 语句 依然 没 用 上 fact_type 索引 ， 但 其 执行 效率 还 是 提升 了 ， 因 为 规划 器 仅 
对 facts 表 做 了 一 次 扫描 。 一 般 来 疝 ， 执 行 计划 越 短 小 ， 其 执行 过 程 就 越 容易 理解 ， 执 行 
效率 也 越 高 ， 不 过 这 并 不 是 绝对 的 。 


9.3.4 ”使 用 Filter 语 法 替代 CASE 语 法 
PostgreSQL 9.4 中 引入 了 新 的 FILTER 关键 字 ，7.15 节 中 介绍 过 其 用 法 。 在 使 用 了 CASE 的 聚 
合 函 数 中 总 是 可 以 用 FILTER 来 代替 CAsE， 替 换 以 后 不 但 语法 上 看 起 来 更 整洁 ， 而 且 在 很 
多 场景 下 执行 效率 也 会 有 所 提高 。 在 示例 9-11 中 ， 我 们 使 用 FILTER 对 示例 9-10 的 语句 进 
行 了 改写 。 
示例 9-11 使 用 FILTER 语法 来 替代 子 查 询 

SELECT T.tract_id, COUNT(*) As tot, 

COUNT(*) FILTER (WHERE F.fact_type_id = 131) AS type_1 
FROM census.Lu_tracts AS T LEFT JOIN census.facts AS F 


ON T.tract_id = F.tract_id 
GROUP BY T.tract id; 
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在 我 们 的 测试 环境 中 ， 用 FILTER 替换 CASE 后 ， 性 能 提升 仅 有 大 约 1 毫秒 ， 而 且 两 种 写法 
的 执行 计划 也 基本 类 似 。 


9.4 并行 化 语句 执行 


并 行 化 语句 的 执行 过 程 会 被 规划 器 分 发 给 多 个 后 台 进 程 去 执行 。 通 过 这 种 并 行 执行 方式 ， 
PostgreSQL 能 够 充分 发 挥 多 核 处 理 器 的 威力 ， 从 而 让 语句 执行 更 快 完成 。 通 过 并 行 执行 所 
能 节省 的 时 间 根 据 服务 器 上 CPU 核 数 的 多 寒 而 有 所 不 同 ， 机 器 强大 的 情况 下 有 可 能 是 非 
常 可 观 的。 两 核 的 机 器 上 可 能 节省 50% 的 时 间 ， 四 核 的 机 器 上 可 能 节省 75% 的 时 间 。 


并 行 化 特性 在 PostgreSQL 9.6 中 引入 ， 当 时 能 够 支持 并 行 化 的 语句 类 型 比较 有 限 ， 一般 仅 
包括 那 种 比较 直观 的 查询 语句 。 但 随 着 新 版 本 的 发 布 ， 我 们 希望 有 越 来 越 多 类 型 的 语句 能 
够 支持 并 行 化 。 

在 PostgreSQL 10 中 ， 不 能 并 行 化 的 语句 类 型 如 下 。 


。 所 有 DML 数据 操纵 语句 ， 比 如 更 新 、 揪 入 和 删除 操作 。 

。 所 有 DDL 数据 定义 语句 ， 比 如 建 表 、 加 字段 、 建 索引 等 。 

。 在 游标 遍历 过 程 中 或 者 循环 体 中 执行 的 查询 语句 。 

。 部 分 聚合 操作 。 和 常见 的 COUNT 和 SUM 聚合 都 已 支持 并 行 化， 但 DISTINCT 和 ORDER BY 还 
不 支持 。 

。 自 定义 函数 。 默 认 情 况 下 ， 自 定义 函数 被 设置 为 PARALLEL UNSAFE 模式 ， 即 不 能 安全 地 
进行 并 行 化 操作 ， 但 如 果 你 确定 你 的 自 定 义 函 数 是 可 以 并 行 的 ， 那 么 可 以 通过 8.1 节 中 
介绍 的 PARALLEL 相关 参数 来 启用 自 定义 函数 的 并 行 化 能 

如 需 开 启 并 行 化 语句 执行 能 力 ， 请 遵循 以 下 指导 进行 系统 参数 配置 。 

。 dynamic_shared_memory 不 允许 设置 为 none。 

。 max_worker_processes 需要 设置 为 大 于 0。 

。 max_parallel_workers 是 PostgreSQL 10 中 新 引入 的 一 个 参数 ， 需 要 设置 为 大 于 0 并 且 
小 于 max_worker_processes 的 值 。 

。 max_parallel_workers_per_gather 需要 设置 为 大 于 0 并 且 小 于 等 于 max_worker_processes 
的 值 。 对 PostgreSQL 10 来 说 ， 该 参数 的 值 还 必须 小 于 等 于 max_paraLteL_workers。 该 
参数 可 以 在 会 话 级 或 者 函数 级 进行 设置 。 


9.4.1 并 行 化 的 执行 计划 是 什么 样子 

我 们 如 何 知道 一 个 语句 已 经 真正 地 被 并 行 化 执行 了 呢 ?” 当 然 是 通过 执行 计划 查看 最 直观 。 
并 行 化 功能 是 通过 规划 器 中 一 个 名 为 采集 节点 (gather node) 的 模块 实现 的 。 因 此 如 果 你 
在 执行 计划 中 看 到 了 gather node 字样 ， 那 么 说 明 该 语句 已 经 或 多 或 少 地 用 上 了 并 行 化 功能 
了 。 一 个 采集 布点 仅 包含 一 个 执行 计划 ， 然 后 会 把 该 执行 计划 分 发 给 多 个 worker 去 执行 。 
每 个 worker 就 是 一 个 独立 的 PostgreSQL 后 台 进 程 ， 每 个 后 台 进 程 负责 处 理 整 个 查询 中 的 
一 部 分 工作 。 所 有 worker 的 工作 成 果 会 被 一 个 担任 leader 角色 的 worker 搜集 到 一 起 。 担 
任 leader 角色 的 worker 和 其 他 普通 worker 一 样 ， 也 要 处 理 gather node 分 派 给 自己 的 计算 
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任务 ， 但 它 比 其 他 普通 worker 多 一 项 任务 ， 就 是 要 搜集 所 有 普通 worker 的 工作 成 果 。 如 
果 gather node 是 整个 执行 计划 的 根 节点 ， 那 么 说 明 整 个 执行 计划 是 彻底 并 行 化 执行 的 ， 如 
果 gather node 出 现在 比较 低 的 层级 中 ， 那 么 只 有 对 应 层级 的 工作 是 并 行 化 的 。 


为 了 便于 调试 ， 我 们 可 以 借助 一 个 名 为 force_parallel_mode 的 参数 。 当 该 参数 被 设置 为 
true 时 ， 规 划 器 会 用 并 行 模式 去 执行 所 有 可 并 行 化 的 语句 ， 即 使 规划 器 判定 使 用 并 行 模 
式 并 不 会 比 非 并 行 模式 快 ， 它 也 会 这 么 干 。 当 需要 判定 一 个 语句 为 什么 没有 被 并 行 化 执行 
时 ， 该 参数 非常 有 用 。 但 请 切记 ， 不 要 在 正式 的 生产 环境 中 打开 该 参数 | 
目前 为 止 ， 我 们 在 本 章 中 给 出 的 例子 都 不 会 触发 并 行 执行 ， 因 为 将 其 并 行 化 执行 需要 启动 
后 台 进 程 ， 而 启动 这 些 后 台 进 程 的 成 本 已 经 超过 了 并 行 化 带 来 的 收益 。 为 了 确认 有 的 语句 
在 并 行 化 执行 的 情况 下 反而 比 没有 并 行 化 更 慢 ， 先 设置 该 参数 : 

Set force_ parallel mode = true; 
然后 再 次 运行 示例 9-4， 甚 输出 结果 如 示例 9-12 所 示 。 


示例 9-12 通过 EXPLAIN (ANALYZE) 命令 得 到 并 行 执 行 计划 
Gather 
(cost=1029.57..1051.65 rows=192 width=64) 
(actual time=12.881..13.947 rows=1 loops=1) 
Workers Planned: 1 
Workers Launched: 1 
Single Copy: true 
-> HashAggregate 
(cost=29.57..32.45 rows=192 width=64) 
(actual time=0.230..0.231 rows=1 loops=1) 
Group Key: "left"((tract_id)::text, 5) 
-> Bitmap Heap Scan on hisp_pop 
(cost=10.25..28.61 rows=192 width=36) 
(actual time=0.127..0.184 rows=204 loops=1) 
Recheck Cond: 
(((tract_ id)::text >= '25025000000'::text) AND 
((tract_id)::text <= '25025999999'::text)) 
-> Bitmap Index Scan on hisp_pop_pkey 
(cost=0.00..10.20 rows=192 width=0) 
(actual time=0.106..0.106 rows=204 loops=1) 
Index Cond: 
(((tract id)::text >= '25025000000'::text) AND 
((tract_ id)::text <= '25025999999'::text)) 
Planning time: 0.416 ms 
Execution time: 16.160 ms 


可 以 看 到 ， 启 动 额外 的 worker (即使 只 启动 一 个 ) 带 来 的 时 间 消 耗 显 著 地 增加 了 总 体 查 询 
所 需 的 时 间 。 

一 般 来 说 ， 对 于 耗 时 几 翔 秒 的 查询 语句 做 并 行 化 是 没什么 必要 的 。 但 需要 访问 极 大 数据 集 
的 查询 通常 需要 耗 时 儿 秒 其 至 儿 分 钟 ， 此 时 并 行 化 的 价值 就 能 体现 出 来 了 ， 初 始 化 时 启动 
额外 worker 的 成 本 会 远 远 小 于 并 行 化 带 来 的 收益 。 

为 了 演示 并 行 化 的 威力 ， 我 们 下 载 了 美国 劳动 统计 局 的 一 份 数据 ， 其 中 包含 650 万 条 记 
录 ， 然 后 对 这 些 数据 进行 查询 ， 如 示例 9-13 所 示 。 
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示例 9-13 并行 化 的 GROUP BY 操作 
set max_parallel workers_per_gather=4; 
EXPLAIN ANALYZE VERBOSE 
SELECT COUNT(*), area_type_code 
FROM Labor 
GROUP BY area_type_code 
ORDER BY area_type_code; 


Finalize GroupAggregate 
(cost=104596.49..104596.61 rows=3 width=10) 
(actual time=500.440. .500.444 rows=3 Loops=1) 
Output: COUNT(* ) ，area_type_code 
Group Key: Labor .area_type_code 
-> Sort 
(cost=104596.49..104596.52 rows=12 width=10) 
(actual time=500.433..500.435 rows=15 loops=1) 
Output: area_type_code, (PARTIAL COUNT(*)) 
Sort Key: labor.area_type_code 
Sort Method: quicksort Memory: 25kB 
-> Gather 
(cost=104595.05. .104596.28 rows=12 width=10) 
(actual time=500.159..500.382 rows=15 loops=1) 
Output: area_type_code, (PARTIAL COUNT(*)) 
Workers Planned: 4 
Workers Launched: 4 
-> Partial HashAggregate 
(cost=103595.05. .103595.08 rows=3 width=10) 
(actual time=483.081..483.082 rows=3 loops=5) 
Output: area_ type_code, PARTIAL count(*) 
Group Key: labor.area_ type_code 
Worker 0: actual time=476.705..476.706 rows=3 loops=1 
Worker 1: actual time=480.704..480.705 rows=3 Loops=1 
Worker 2: actual time=480.598..480.599 rows=3 Loops=1 
Worker 3: actual time=478.000..478.000 rows=3 Loops=1 
-> Parallel Seq Scan on pubLic.Labor 
(cost=0.00..95516.70 rows=1615670 width=2) 
(actual time=1.550..282.833 rows=1292543 loops=5) 
Output: area_type_code 
Worker 0: actual time=0.078..282.698 rows=1278313 loops=1 
Worker 1: actual time=3.497..282.068 rows=1338095 loops=1 
Worker 2: actual time=3.378..281.273 rows=1232359 loops=1 
Worker 3: actual time=0.761..278.013 rows=1318569 loops=1 
Planning time: 0.060 ms 
Execution time: 512.667 ms 


为 了 拿 未 开启 并 行 时 的 执行 成 本 估算 和 执行 时 间 来 进行 对 比 ， 我 们 设置 max_parallel_ 
workers_per_gather=0， 然 后 拿 到 执行 计划 ， 如 示例 9-14 所 示 。 


示例 9-14 非 并 行 化 执行 的 GROUP BY 操作 
set max_parallel workers_per_gather=0; 
EXPLAIN ANALYZE VERBOSE 
SELECT COUNT(*), area_type_code 
FROM Labor 
GROUP BY area_type_code 
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ORDER BY area_type_code; 


Sort 
(cost=176300.24..176300.25 rows=3 width=10) 
(actual time=1647.060..1647.060 rows=3 loops=1) 
Output: (COUNT(*)), area_type_code 
Sort Key: Labor.area_type_code 
Sort Method: quicksort Memory: 25kB 
-> HashAggregate 
(cost=176300.19..176300.22 rows=3 width=10) 
(actual time=1647.025..1647.025 rows=3 Loops=1) 
Output: count(*), area_type_code 
Group Key: Labor.area_type_code 
-> Seq Scan on pubLic.Labor 
(cost=0.00..143986.79 rows=6462679 width=2) 
(actual time=0.076..620.563 rows=6462713 loops=1) 
Output: series id, year, period, value, footnote codes, area_type_code 
Planning time: 0.054 ms 
Execution time: 1647.115 ms 


两 种 执行 模式 下 得 到 的 结果 是 一 样 的 : 

















Count | area_type_code 
EL pe 
3718937 | NM 

2105205 | N 

638571 | S 

(3 rows) 


在 并 行 化 模式 下 ， 总 共 四 个 worker， 每 个 worker 完成 自己 的 工作 大 约 耗 时 280 毫秒 。 


9.4.2 并行 化 扫描 


并 行 执行 模式 下 有 专门 的 扫描 策略 来 将 整个 扫描 任务 切 分 给 多 个 worker。 在 PostgreSQL 
9.6 中 ， 只 有 全 表 扫 描 可 以 并 行 执行 。PostgreSQL 10 中 新 增 了 对 位 图 堆 扫描 (bitmap heap 
scan)、 索 引 扫 描 (index scan) 以 及 仅 索引 扫描 (index-only scan) 的 并 行 化 支持 。 然 而 对 
于 索引 扫描 和 仅 索 引 扫 描 ， 目 前 还 只 有 当 使 用 了 B- 树 索引 时 才能 实现 并 行 。 位 图 堆 扫 描 则 
无 此 限制 ， 基 于 任何 类 型 索引 的 位 图 堆 扫描 操作 过 程 都 可 以 实现 并 行 。 但 请 注意 ， 位 图 堆 
扫描 过 程 中 的 建 位 图 索引 步骤 是 不 可 并 行 的 ， 因 此 所 有 的 worker 必须 等 到 位 图 索引 构建 完 
毕 才 能 开始 并 行 工作 。? 








































































































注 1: 指 查询 目标 字段 上 全 部 都 建 有 索引 ， 因 此 仅 需 扫描 索引 即 可 得 到 结果 ， 无 须 访问 本 表 。 一 一 译 者 注 
注 2: 位 图 堆 扫 描 过 程 简要 说 明 如 下 : 先 根据 表 本 体 所 占用 的 物理 磁盘 PAGE 数 建立 一 个 位 图 区 ， 其 中 每 
BIT 位 都 对 应 表 本 体 上 的 一 个 物理 磁盘 PAGE 页 面 。 然 后 把 从 索引 上 查 出 来 的 目标 记录 位 置 写 和 人 
该 位 图 区 ， 落 在 哪个 PAGE 页 面 就 把 其 对 应 的 BIT 位 置 为 1。 当 整个 位 图 索引 构建 完毕 后 ， 按 照 从 前 
到 后 的 顺序 扫描 表 本 体 取 数 据 ， 这 样 可 以 保证 表 本 体 上 的 每 个 PAGE 只 需 读 取 一 遍 ， 相 比 不 使 用 位 
图 堆 扫 描 技术 的 扫描 方法 大 大 节省 了 IO。 详情 可 参见 https://dba.stackexchange.com/questions/119386/ 
译 者 注 
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9.4.3 并行 化 关联 操作 

关联 操作 也 可 以 实现 并 行 化 。 在 PostgreSQL 9.6 中 ， 幅 大 ,循环 关联 和 散 列 关联 这 两 种 关联 
模式 都 是 可 并 行 化 的 。 
在 内 套 循环 关联 过 程 中 ， 每 个 worker 只 需 对 分 配给 它 的 数据 子 集 做 关联 运算 ， 关 联 对 象 是 
所 有 worker 共享 的 被 关联 表 。 


在 散 列 关联 过 程 中 ， 每 个 worker 会 先 构造 一 份 全 量 的 散 列 表 ， 然 后 拿 自己 负责 的 那 部 分 其 
他 表 数 据 和 这 个 全 量 散 列表 做 关联 条 件 判定 。 由 于 每 个 worker 都 需要 构建 一 个 全 量 的 散 列 
表 ， 而 它 自己 不 可 能 用 到 全 量 的 散 列 数据 ， 因 此 显然 worker 之 间 有 很 多 元 余 运 算 。 所 以 ， 
如 果 创 建 散 列表 是 个 很 昂贵 的 操作 ， 并 行 化 的 散 列 关联 的 速度 会 比 非 并 行 化 关联 操作 慢 。 
PostgreSQL 10 中 支持 merge 关联 的 并 行 化 。merge 关联 与 散 列 关联 存在 类 似 的 问题 ， 即 
每 个 worker 都 要 对 关联 操作 某 一 侧 的 表 进 行 完全 处 理 ， 因 此 worker 之 间 必 然 会 存在 重 
复 运 算 。 


9.5 ”人 工 干 预 规划 器 生成 执行 计划 的 过 程 


规划 器 生成 执行 计划 的 行为 会 受到 多 方面 因素 的 影响 ， 具体 包 括 : 是 否 有 合适 的 索引 、 执 
行 成 本 设置 、 执 行 策略 设置 以 及 数据 如 何 分 布 等 。 本 市 将 介绍 多 种 可 以 对 规划 器 施加 入 工 
干预 的 方法 ， 通 过 这 些 方法 可 以 得 到 更 合理 的 执行 计划 。 


9.5.1 策略 设置 


与 某 些 其 他 数据 库 产 品 不 同 的 是 ，PostgreSQL 查询 规划 器 不 接受 索引 提示 ， 但 你 可 以 逐 
个 查询 或 永久 禁用 各 种 策略 设置 〈 比 如 全 表 扫 描 、 位 图 扫描 、 散 列 聚合 、 散 列 关 联 等 都 
是 一 种 执行 策略 ， 都 有 相应 的 策略 设置 )， 以 阻止 规划 器 选 出 某 些 效率 较 低 的 执行 策略 。 
PostgreSQL 官方 手册 中 的 “规划 器 方法 配置 ”一 市 中 介绍 了 所 有 规划 器 优化 设置 。 默 认 情 
况 下 ， 所 有 策略 设置 都 已 启用 ， 此 时 规划 器 因为 不 受 什 么 约束 所 以 灵活 性 是 最 大 的 。 如 有 果 
你 对 要 查询 的 数据 的 特点 预先 有 了 一 定 了 解 ， 那 么 就 可 以 有 针对 性 地 禁用 某 些 策略 来 优化 
语句 的 执行 路 径 。 不 过 请 注意 ， 即 使 你 设置 了 某 种 策略 为 禁用 ， 也 并 不 意味 着 规划 器 就 一 
定 不 会 使 用 该 策略 。 规 划 器 仅 将 这 些 设 置 当 作用 户 的 建议 ， 最 终 的 决定 权 还 是 在 规划 器 。 


我 们 有 时 候 会 将 enable_nestloop ( 髓 套 循 环 ) 和 enable_seqscan (全 表 扫 描 ) 这 两 个 设 
置 设 为 “禁用 ”， 因 为 这 两 种 执行 策略 在 大 多 数 情况 下 的 效率 是 很 低 的 ， 当 然 并 不 是 所 有 
情况 下 都 这 样 。 你 可 以 禁用 这 两 种 执行 策略 ， 但 规划 器 在 没有 别 的 选择 时 还 是 可 能 会 使 用 
的 ， 因 为 无 论 如 何 至 少 应 该 保证 语句 可 以 正常 执行 。 如 果 你 在 执行 计划 中 看 到 了 全 表 扫 描 
和 藤 套 循环 这 两 种 执行 策略 ， 那 么 建议 核查 一 下 到 底 是 因为 规划 器 已 经 找 不 到 更 好 的 策略 
所 以 不 得 不 用 ， 还 是 规划 器 选择 了 错误 的 策略 。 一 个 快速 鉴别 的 办 法 是 先 禁用 该 策略 ， 然 
后 对 禁用 前 后 的 执行 计划 进行 比较 。 如 有 果 禁 用 前 的 执行 计划 中 使 用 了 该 策略 但 禁用 后 却 不 
使 用 了 ， 那 么 再 进一步 比较 一 下 这 两 种 情况 下 执行 计划 的 真实 成 本 ， 就 可 以 看 出 选择 该 策 
略 到 底 是 快 了 还 是 慢 了 。 



















































































































































































查询 性 能 调 优 | 205 


9.5.2 ”你 的 索引 被 用 到 了 吗 


如 果 规 划 器 选择 了 全 表 扫 描 策略 ， 就 意味 着 后 续 执行 过 程 中 会 从 头 到 尾 读 取 表 中 的 每 一 条 
记录 。 规 划 器 会 在 以 下 两 种 情况 下 选择 全 表 扫 描 策略 : 一 种 情况 是 表 上 没有 合适 的 索引 能 
满足 查询 条 件 的 要 求 ， 另 外 一 种 是 规划 器 认为 通过 索引 来 查找 数据 的 成 本 要 高 于 全 表 扫 
描 。 如 果 你 禁用 了 全 表 扫 描 策 略 ， 但 规划 器 依然 选择 了 这 么 干 ， 这 就 说 明 表 上 无 索引 或 者 
虽然 有 索引 但 不 适用 此 语句 的 查询 条 件 。 有 两 个 错误 是 大 家 经 常会 犯 的 ， 一 个 是 表 上 缺 
少 必要 的 索引 ， 另 一 个 是 索引 建 得 不 对 而 导致 查询 语句 用 不 上 。 通 过 查询 pg_stat_user_ 
indexes 和 pg_stat_user_tables 这 两 个 视图 可 以 很 方便 地 得 知 你 的 索引 是 否 被 用 上 了 。 如 
需 了 解 哪些 语句 执行 得 慢 ， 请 安装 pg_stat_statements 扩展 包 ， 其 用 法 在 9.2 节 中 已 经 介 
绍 过 。 


下 面 通过 若干 例子 来 说 明 。 还 是 使 用 示例 7-22 中 创建 过 的 表 ， 我 们 在 该 表 的 数组 列 fact_ 
subcats 上 建立 一 个 GIN 索引 ，GIN 类 型 的 索引 是 为 数 不 多 的 能 够 支持 数组 类 型 的 索引 。 
语句 如 下 : 


CREATE INDEX idx_lu_fact types ON census.lu fact types USING gin (fact_ 
subcats); 


接 下 来 执行 一 个 查询 语句 以 验证 所 建 索引 是 否 有 效 ， 查 询 条 件 为 : fact_subcats 数组 列 中 
要 包含 “White alone” 和 “Asian alone” 这 两 个 元 素 。 虽 然 全 表 扫 描 策 略 的 默认 设置 就 是 
“启用 ”， 但 我 们 还 是 显 式 地 设 定 一 下 以 防 万 一 。 示 例 9-15 显示 了 该 语句 的 执行 计划 。 


示例 9-15 ”允许 规划 器 选择 全 表 扫 描 策略 
set enable_seqscan = true; 
EXPLAIN(ANALYZE) 
SELECT * 
FROM census.lyu_fact types 
WHERE fact_subcats && '{White alone, Black alone}'::varchar[]; 









































Seq Scan on Lu_fact_types 

(cost=0.00..2.85 rows=2 width=200) 

(actual time=0.066..0.076 rows=2 loops=1) 

Filter: (fact_subcats 
&& '{"White alone","Black alone"}'::character varying[]) 
Rows Removed by Filter: 66 

Planning time: 0.182 ms 
Execution time: 0.108 ms 


请 注意 ， 在 启用 全 表 扫 描 策略 的 情况 下 ， 规 划 器 忽略 了 索引 而 选用 了 全 表 扫 描 策略 。 这 可 
能 是 因为 表 的 规模 很 小 或 者 是 因为 索引 不 适用 于 本 语句 中 的 查询 条 件 。 在 示例 9-16 中 ,我 
们 执行 的 语句 相同 ， 但 通过 禁用 全 表 扫 描 策 略 来 强迫 规划 器 使 用 了 索引 。 


示例 9-16 ”禁用 全 表 扫 描 策略 ， 强 行 要 求 使 用 索引 
set enable seqscan = false; 
EXPLAIN (ANALYZE) 
SELECT * 
FROM census.Lu_fact_types 
WHERE fact_subcats && '{White alone, Black alone}'::varchar[]; 
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Bitmap Heap Scan on Lu_fact_types 
(cost=12.02..14.04 rows=2 width=200) 
(actual time=0.058..0.058 rows=2 loops=1) 
Recheck Cond: (fact_subcats 
&& '{"White alone","Black alone"}'::character varying[]) 
Heap Blocks: exact=1 
-> Bitmap Index Scan on idx_lu fact types 
(cost=0.00..12.02 rows=2 width=0) 
(actual time=0.048..0.048 rows=2 loops=1) 
Index Cond: (fact_subcats 
&& '{"White alone","Black alone"}'::character varying[]) 
Planning time: 0.230 ms 
Execution time: 0.119 ms 


通过 该 执行 计划 可 以 看 到 ， 索 引 建 得 没 问 题 ， 是 可 以 使 用 的 ， 却 使 得 整个 查询 的 执行 耗 时 
更 长 ， 因 为 基于 索引 的 查询 成 本 要 比 基 于 全 表 扫 描 的 成 本 高 。 因 此 ， 正 常情 况 下 规划 器 将 
选择 使 用 全 表 扫 描 策略 。 但 随 着 表 中 数据 的 增加 ， 我 们 将 会 看 到 规划 器 优先 选择 索引 查询 
策略 。 

为 了 与 前 面 的 例子 做 个 对 比 ， 假 设 我 们 需要 执行 如 下 这 样 一 个 查询 : 


SELECT * FROM census.lu_fact types WHERE 'White alone' = ANY(fact_subcats); 


我 们 会 看 到 ， 不 管 将 enable_seqscan 设 为 启用 还 是 禁用 ， 规划 器 总 是 会 选择 执行 全 表 扫 
描 ， 因 为 此 时 索引 无 法 满足 查询 条 件 的 需要 。 因 此 ， 建 立 合适 的 索引 并 编写 正确 的 、 能 

上 索引 的 SQL 是 很 重要 的 。 保 证 了 这 些 以 后 ， 后 续 的 工作 就 是 多 试验 几 次 ， 以 确保 生成 的 
执行 计划 是 最 优 的 。 


9.5.3” 表 的 统计 信息 

你 可 能 会 认为 规划 器 神秘 又 强大 ， 但 无 论 如 何 规划 器 并 不 是 神 ， 它 只 是 遵循 一 套 设 定好 的 
算法 来 生成 执行 计划 。 关 于 规划 器 算法 的 内 容 细节 远 远 超出 了 本 书 的 范畴 ， 在 此 不 做 讨 
论 。 虽 然 规 划 器 的 算法 严重 依赖 于 表 的 统计 信息 ， 但 规划 器 不 会 在 每 次 生成 执行 计划 之 前 
临时 扫描 所 有 的 相关 表 以 获取 其 统计 信息 ， 因 为 如 果 那 么 做 的 话 任何 语句 的 执行 都 将 巨 慢 
无 比 ， 完 全 没有 执行 效率 可 言 ， 所 以 规划 器 会 依赖 预先 搜集 好 的 表 统 计 信息 。 


因此 ， 要 想 规 划 器 能 够 做 出 准确 的 决定 ， 及 时 准确 地 更 新 表 统 计 信息 是 至 关 重 要 的 。 如 果 
统计 信息 与 实际 情况 相差 太 大 ， 规 划 器 很 可 能 会 常常 推导 出 错误 的 执行 计划 ， 最 差 的 情况 
就 是 错误 地 选择 了 全 表 扫 描 策 略 。 一 般 来 说 ， 平 均一 张 表 只 有 20% 的 记录 采样 率 ， 统 计 信 
息 会 基于 这 些 参与 采样 的 记录 来 生成 。 对 于 非常 大 的 表 来 说 ， 采 样 率 可 能 更 低 。 你 可 以 通 
过 设置 STATISTICS 值 来 修改 在 每 一 列 上 采样 的 行 数 。 

通过 查询 pg_stats 表 ， 可 以 了 解 到 规划 器 剔除 了 哪些 统计 信息 以 及 使 用 了 哪些 统计 信息 ， 
查询 方法 如 示例 9-17 所 示 。 
示例 9-17 数据 分 布 直方 图 

SELECT 


attname As coLname ， 
n_distinct, 
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most_common_vals AS common_vals, 
most_common_freqs As dist freq 

FROM pg_stats 

WHERE tablename = 'facts' 

ORDER BY schemaname, tablename, attname; 


colname | n_distinct | common_vals | dist freq 


fact_type id | 68 | {135,113... | {0.0157,0.0156333,... 

perc | 985 | {0.00,... | {0.1845,0.0579333,0.056... 
tract_id | 1478 | {25025090300... | {0.00116667,0.00106667,0.0... 
val | 3391 | {0.000,1.000,2...| {0.2116,0.0681333,0... 

yr | 2 | {2011,2010} | {0.748933,0.251067} 


pg_stats 表 给 出 了 表 中 指定 列 的 值 域 分 布 图 ， 规划 器 会 根据 此 信息 制订 相应 的 执行 计划 。 
系统 后 台 会 有 一 个 进程 持续 不 断 地 更 新 pg_stats 表 。 当 表 中 插入 或 者 删除 大 量 数据 后 ， 你 
应 该 手动 执行 VACUUM ANALYZE 来 更 新 表 的 统计 信息 。VACCUM 指示 将 已 删除 的 记录 永久 性 地 
从 表 中 移 除 ，ANALYZE 指示 更 新 表 的 统计 信息 。 

对 于 经 常 参与 关联 查询 并 且 在 WHERE 子 句 中 频繁 使 用 的 列 ， 应 该 考虑 提升 采样 的 行 数 。 所 
需 执 行 的 代码 如 下 : 


ALTER TABLE census .facts ALTER COLUMN fact_type_id SET STATISTICS 1000; 




















PostgreSQL 10 中 新 增 了 对 于 多 字段 统计 信息 的 支持 ， 相 应 的 语法 是 CREATE STATISTICS。 
该 特性 使 得 用 户 能 够 针对 多 个 字段 的 组 合 来 创建 统计 对 象 。 如 果 表 中 某 些 字段 的 值 之 间 存 
在 关联 ， 那 么 多 字段 统计 信息 就 能 发 挥 作用 。 比 如 某 些 数据 仅 适 用 于 某 一 特定 年 份 ， 而 不 
适用 于 其 他 年 份 。 假 设 这 两 个 字段 分 别 为 fact_type_id 和 yr， 那 么 可 以 针对 这 两 个 字段 创 
建 一 个 多 字段 统计 信息 ， 如 示例 9-18 所 示 。 


示例 9-18 多 字段 统计 信息 
CREATE STATISTICS census.stats_facts_type_yr_dep_dist (dependencies, ndistinct) 
ON fact type_id, yr FROM census .facts; 
ANALYZE census .facts; 


CREATE STATISTICS 语句 中 必须 指定 同一 张 表 中 的 两 个 或 者 多 个 字段 。 示 例 9-18 中 为 
census.facts 表 中 的 fact_type_id 和 yr 字段 创建 了 统计 信息 。 另 外 ， 建 议 为 统计 信息 
起 个 名 字 ， 当 然 这 个 名 字 其 实 是 可 选 的 。 如 果 你 在 起 名 时 带 了 schema 的 名 字 (上 例 中 
census.stats_facts_type_yr_dep_dist 里 面 的 census 就 是 schema 的 名 字 )， 那 么 该 统计 信 
息 默 认 会 被 创建 到 该 schema 中 ， 不 指定 则 会 被 创建 到 默认 schema 中 。 


你 可 以 采集 两 种 统计 信息 ， 创 建 时 必须 至 少 指定 其 中 一 种 。 


。 第 一 种 是 数据 依赖 统计 信息 ， 记 录 了 不 同 字段 间 值 的 依赖 性 。 例 如 ， 只 有 当 城 市 名 为 波 
士 顿 时 才 会 出 现 邮政 编码 02109。 只 有 当 优 化 器 对 带 等 值 判定 的 语句 进行 优化 时 ， 数 据 
依赖 统计 信息 才能 发 挥 作用 ， 例 如 这 种 条 件 : city = 'Boston' and zip = '02109 '。 

。 第 二 种 是 ndistinct 统计 信息 ， 记 录 了 不 同 字段 值 一 起 出 现 的 频率 ， 并 且 会 针对 字段 列表 
中 每 种 排列 组 合 都 进行 统计 。ndistinct 统计 信息 专用 于 提升 GROUP BY 操作 的 效率 ， 而 且 
仅 当 GROUP BY 子 句 中 的 字段 全 部 落 在 统计 信息 所 包含 的 字段 列表 中 时 ， 才 能 发 挥 作用 。 
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CREATE STATISTICS 所 创建 的 统计 信息 都 存在 pg_statistic_ext 表 中 ， 可 以 使 用 DROP 
STATISTICS 命令 删除 。 与 其 他 所 有 统计 信息 类 似 ， 该 类 统计 信息 是 在 ANALYZE 命令 执行 期 
间 计 算出 来 的 ， 而 ANALYZE 操作 是 由 系统 的 自动 清理 及 分 析 进 程 (官方 名 称 为 autovacuum 
进程 ) 自动 执行 的 。 建 议 在 建 完 表 之 后 立即 对 其 运行 一 次 ANALYZE 命令 ， 这 样 该 表 的 统计 
信息 立即 就 可 以 被 优化 器 用 到 。 


9.5.4 磁盘 页 的 随机 访问 成 本 以 及 磁盘 驱动 器 的 性 能 

另 一 个 会 影响 规划 器 执行 策略 选择 的 设置 是 random_page_cost (随机 页 访问 成 本 比 ， 简 称 
RPC) 比率 ， 它 表示 在 磁盘 上 顺序 读 取 和 随机 读 取 同 一 条 记录 的 性 能 之 比 。 一 般 来 说 ， 物 
理 磁盘 速度 越 快 (一 般 也 会 越 贵 )， 该 比率 就 会 越 小 。RPC 的 默认 值 是 4， 该 值 适用 于 目前 
市 面 上 的 大 多 数 机 械 硬 盘 。 但 如 果 使 用 的 是 固态 硬盘 或 者 SAN 存储 系统 ， 有 必要 对 此 值 
进行 调整 。 

你 可 以 在 database、 服 务 器 、 表 空间 这 三 个 级 别 设置 RPC 比率 。 如 果 要 在 服务 器 级 别 设置 
该 比率 ， 直 接 在 postgresql.conf 文件 中 设置 即 可 。 如 果 同 一 台数 据 库 服务 器 上 使 用 了 不 同 
类 型 的 硬盘 ， 并 且 不 同 的 表 空间 落 在 不 同 的 硬盘 上 ， 那 么 可 以 在 表 空间 级 别 设置 RPC 比 
率 ， 语 法 如 下 所 示 。 


ALTER TABLESPACE pg default SET (random page_cost=2); 
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有 关 该 设置 的 详细 信息 ， 请 参考 “Random Page Cost Revisited” 这 篇 博文 。 这 篇 文章 建议 
采用 以 下 设置 。 

。 高 端 NAS/SAN 存储 : 2.5 或 者 3.0 

。 亚马逊 EBS 和 Heroku 云 平台 : 2.0 

。 iSCSI 和 其 他 普通 SAN 存储 : 6.0， 但 可 能 变化 比较 大 ， 需 要 按照 实际 情况 设 定 

。 固态 硬盘 : 2.0 至 2.5 

。 NvRAM (也 叫 NAND) : 1.5 


9.6 ”数据 缓存 机 制 


如 果 你 之 前 执行 过 一 个 复杂 且 耗 时 较 长 的 查询 ， 那 么 后 续 再 次 执行 此 查询 时 会 发 现 快 了 很 
多 ， 这 是 因为 系统 的 数据 缓存 机 制 发 挥 了 作用 。 如 果 同 一 个 查询 语句 按 顺 序 多 次 执行 ， 而 
且 这 些 查询 涉及 的 底层 数据 并 没有 发 生变 化 ， 那 么 不 管 这 些 语句 是 被 同一 个 用 户 还 是 多 个 
用 户 执 行 ， 最 终 得 到 的 结果 都 应 该 是 一 样 的 。 只 要 内 存 中 还 有 空间 可 用 于 缓存 数据 ， 那 么 
规划 堪 就 可 能 会 跳 过 生成 执行 计划 和 从 磁盘 读 取 表 数据 的 步 又， 直接 从 缓存 中 获取 数据 。 
如 果 语 名 中 使 用 了 CTE 表达 式 和 结果 不 变 式 函 数 (这 类 函数 的 运算 结果 不 依赖 外 部 数据 ， 
仅 依赖 输入 的 数据 ， 也 就 是 说 固定 的 输入 一 定 能 得 到 固定 的 输出 )， 那 么 系统 会 更 加 倾向 
于 进行 结果 集 缓存 。 
那么 如 何 查看 系统 中 缓存 了 哪些 数据 呢 ? 可 以 通过 安装 pg_buffercache 扩展 包 来 查看 。 

CREATE EXTENSION pg_buffercache; 


安装 完毕 后 ， 你 可 以 查询 pg_buffercache 视图 ， 如 示例 9-19 所 示 。 
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示例 9-19 查看 表 数 据 是 否 已 被 缓存 

SELECT 
C.reLname， 
COUNT(CASE WHEN B.isdirty THEN 1 ELSE NULL END) As dirty_buffers, 
COUNT(*) As num_buffers 

FROM 
pg_class AS C INNER JOIN 
pg_buffercache B ON C.relfilenode = B.relfilenode INNER JOIN 
pg_database D ON B.reLdatabase = D.oid AND D.datname = current_database() 

WHERE C.relname IN ('facts'，'Lu fact types') 

GROUP BY C.relname; 


示例 9-19 中 的 语句 查 出 了 facts 和 Lu_fact_types 这 两 张 表 中 被 缓存 的 页 数 。 需 要 先 实 际 
执行 一 个 SQL 查询 语句 ， 才 会 有 数据 被 真正 缓存 下 来 ， 此 后 示例 9-19 中 的 语句 才能 有 结 
果 。 我 们 先 执行 一 下 下 面 这 个 语句 。 
SELECT T.fact_subcats[2], COUNT(*) As num_fact 
FROM 
Census .facts As F 
INNER JOIN 


Census.Lu_fact_types AS T ON F.fact_type_id = T.fact_ type_id 
GROUP BY T.fact_subcats[2]; 


当 再 次 执行 上 述 语句 时 ， 你 应 该 可 以 看 到 至 少 10% 的 性 能 提升 ， 并 且 示 例 9-19 的 查询 可 
以 看 到 类 似 以 下 的 结果 。 

















reLname | dirty_buffers | num_buffers 
de ee a 
facts | 9 | 736 
Lu_fact_types | 0 | 4 


用 于 缓存 数据 的 内 存 大 小 是 可 指定 的 ， 该 值 越 大 ， 能 缓存 的 数据 就 越 多 。postgresql.conf 中 
的 shared_buffers 就 是 用 于 设置 此 值 的 ， 但 不 应 设 得 过 大 ， 否 则 会 耗费 过 多 时 间 去 扫描 组 
存 ， 反 而 降低 了 性 能 。 


由 于 如 今 的 物理 内 存 已 经 极其 廉价 ， 因 此 一 般 不 会 再 出 现 内 存 不 够 的 情况 。 基 于 这 一 点 ， 
我 们 很 容易 就 想到 ， 可 以 将 一 些 常用 的 表 预 先 缓存 到 内 存 中 ， 这 样 就 可 以 提高 后 续 访问 效 
率 。 有 一 个 名 为 pg_prewarn 的 扩展 包 可 以 用 于 实现 此 功能 。pg_prewarn 会 将 指定 的 常用 表 
预 加载 到 缓存 中 ， 此 后 不 管 该 表 是 首次 被 用 户 访问 还 是 非 首次 访问 ， 响 应 速度 总 是 很 快 。 
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复制 与 外 部 数据 





PostgreSQL 有 很 多 方法 可 以 实现 与 外 部 服务 器 或 数据 源 之 间 的 数据 共享 。 第 一 种 就 是 
PostgreSQL 自 带 的 复制 功能 ， 通 过 该 功能 可 以 在 另外 一 台 服 务 器 上 创建 出 当前 服务 器 的 一 
个 镜像 。 第 二 种 方法 是 使 用 第 三 方 插件 ， 其 中 许多 插件 可 以 免费 使 用 ， 并 且 其 可 靠 性 也 是 
久 经 考验 的 。 第 三 种 方法 是 使 用 外 部 数据 封装 器 (foreign data wrapper，FDW)。FDW 支 
持 大 量 的 外 部 数据 产 ， 从 9.3 版 开始 ， 有 些 FDW 也 开始 支持 对 外 部 数据 进行 修改 ， 包 括 
postgres_fdw、hadoop_fdw 和 ogr_fdw (详情 请 参见 10.3.4 节 ) 。 


10.1 复制 功能 概览 


很 多 情况 下 我 们 都 需要 使 用 数据 库 复 制 功能 ， 但 不 管 具体 场景 如 何 ， 其 根本 原因 都 可 以 归 
结 为 两 个 : 提升 数据 的 可 用 性 和 可 扩展 性 。 确 保 可 用 性 的 手段 是 提供 一 台 宛 余 的 备用 服务 
器 ， 如 果 主 服务 器 宕 机 了， 备用 服务 器 应 立即 接管 并 继续 提供 服务 。 对 于 规模 较 小 的 数据 
库 来 说 ， 要 达到 此 目标 只 需要 保证 你 有 男 一 台 备 用 的 物理 服务 器 ， 并 将 数据 库 恢复 到 该 服 
务 器 上 即 可 。 但 对 于 规模 很 大 的 数据 库 (数据 量 为 TB 级 别 ) 来 说 ， 恢 复 过 程 本 身 可 能 需 
要 好 几 个 小 时 甚至 儿 天 ， 而 且 在 此 过 程 中 系统 无 法 对 外 提供 服务 。 为 尽量 减少 服务 中 断 时 
间 ， 你 就 需要 使 用 复制 功能 。 


我 们 需要 复制 功能 的 另 一 个 原因 是 可 扩展 性 诉求 。 假 设 你 开设 了 一 个 网 站 ,做 着 饲养 并 
出 售 象 赐 的 买卖 。 做 了 几 年 之 后 ， 你 已 经 拥有 了 几 千 只 象 购 。 全 世界 的 客户 都 请 到 你 的 
网 站 来 查看 并 购买 ， 结 果 由 于 流量 过 大 导致 网 站 过 载 并 无 法 正常 处 理 请 求 ， 那 么 这 时 候 
就 需要 复制 功能 出 马 了 。 只 需 设 定 一 个 只 读 的 从 属 服务 器 作为 主 服务 器 的 镜像 ， 然 后 就 
可 以 把 海量 的 读 请 求 分 流 到 从 属 服务 器 上 ， 只 有 当 买 家 真正 下 单 时 才 需 要 到 主 服 务 器 上 
执行 操作 。 
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10.1.1 复制 功能 涉及 的 术语 

在 深入 探讨 复制 功能 之 前 ， 先 介绍 一 下 相关 术语 。 

主 服务 器 
主 服务 器 是 作为 要 复制 数据 的 源头 的 数据 库 服务 器 ， 所 有 更 新 都 在 其 上 发 生 。 使 用 
PostgreSQL 的 内 置 复制 功能 时 ， 仅 允许 使 用 一 台 主 服务 器 。 已 有 计划 要 支持 多 主 服 务 
器 复制 方案 ， 请 关注 将 来 的 版 本 。publisher (发 布 者 ) 这 个 词 你 可 能 经 常会 看 到 ， 其 含 
义 是 数据 提供 方 。 在 PostgreSQL 10 内 置 的 逻辑 复制 功能 中 ，publisher/subscriber (发 布 
者 /订阅 者 ) 这 对 术语 会 频频 出 现 。 


从 属 服务 器 
从 属 服务 器 使 用 复制 的 数据 并 提供 主 服 务 器 的 副本 。 尽 管 也 有 人 谈 到 一 些 听 起 来 更 悦耳 
的 术语 (比如 订阅 者 、 代 理 等 ), 但 从 属 服务 器 这 个 名 称 仍 是 最 贴切 的 。PostgreSQL 的 
内 置 复制 功能 目前 仅 支持 只 读 从 属 服务 器 。 

预 写 日 志 (write-ahead log，WAL) 
WAL 就 是 记录 所 有 已 完成 事务 信息 的 日 志文 件 ， 在 其 他 数据 库 产 品 中 一 般 称 为 事务 日 
志 。 为 了 支持 复制 功能 ，PostgreSQL 将 主 服务 器 的 WAL 日 志向 从 属 服务 器 开放 ， 然 后 
从 属 服务 器 持续 地 将 这 些 日 志 取 到 本 地 ， 然 后 将 其 中 记载 的 事务 重演 一 遍 ， 这 样 就 实现 
了 数据 同步 。 


同步 复制 

在 事务 提交 阶段 ，PostgreSQL 需 保 证 已 经 将 此 事务 中 所 做 的 修改 成 功 同 步 到 
synchronous_stand_names 参数 中 所 列 出 的 至 少 一 个 从 属 服务 器 上 ， 然 后 才能 向 用 户 
反馈 事务 提交 成 功 。 在 PostgreSQL 9.6 之 前 ， 只 需 任 何 一 个 同步 服务 器 反馈 成 功 ， 事 
务 就 算 成 功 。 在 PostgreSQL 9.6 以 及 之 后 的 版 本 中 支持 了 一 个 增强 功能 ， 即 可 以 要 求 
至 少 N 个 从 属 服务 器 反馈 成 功 后 整个 事务 才 算 成 功 ， 这 个 N 可 以 在 postgresql.conf 的 
synchronous_standby_names 参数 中 进行 配置 。PostgreSQL 10 更 进一步 支持 了 FIRST 
和 ANY 这 两 个 关键 字 ， 分 别 代表 “只 需 第 一 个 从 属 服务 器 反馈 成 功 ” 和 “只 需 任何 一 
个 从 属 服务 器 反馈 成 功 "， 这 两 个 关键 字 也 是 在 synchronous_standby_names 参数 中 进 
行 配置 。 如 果 不 配 置 该 项 ， 则 默认 值 为 FIRST， 即 只 需 第 一 个 从 属 服务 器 反馈 成 功 ， 
PostgreSQL 9.6 在 默认 情况 下 的 处 理 策略 也 是 如 此 。 


异步 复制 

在 事务 提交 阶段 ， 主 服务 器 上 提交 成 功 就 算 成 功 ， 不 需要 等 待 从 属 服务 器 的 数据 更 新 
成 功 。 当 从 属 服务 器 位 于 远 端 时 该 模式 就 比较 有 用 了 ， 因 为 可 以 避免 网 络 延迟 的 影响 。 
但 有 利 必 有 次 ,该 模式 下 从 属 服务 器 的 数据 更 新 不 够 及 时 ， 与 主 服 务 器 之 间 会 有 一 些 
延迟 。 如 果 主 从 服务 器 之 间 的 延迟 很 严重 ， 以 至 于 主 从 之 间 的 差距 大 到 主 服务 器 上 的 
WAL 事务 日 志 还 没有 传输 到 从 属 服务 器 就 已 经 被 清理 掉 ， 那 么 此 时 其 实 复制 环境 已 经 
被 破坏 且 无 法 恢复 ， 从 属 服务 器 需要 基于 主 服务 器 的 数据 重新 初始 化 一 遍 。 

为 尽量 降低 出 现 上 述 问 题 的 风险 ，PostgreSQL 9.4 中 引入 了 复制 槽 (replication slot) 的 
概念 。 所 谓 “ 复 制 槽 ”是 指 主 从 服务 器 之 间 的 一 种 契约 ， 该 契约 保证 了 在 从 属 服务 器 背 
费 到 相应 的 WAL 日 志 之 前 ， 这 部 分 WAL 日 志 不 会 被 主 服 务 器 删除 。 这 么 做 又 会 导致 
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另 一 个 风险 ， 就 是 如 果 某 个 持 有 “复制 槽 ”的 从 属 服务 器 发 生 故 障 或 者 与 主 服 务 器 之 间 
通信 中 断 ， 那 么 主 服务 器 上 就 不 得 不 永久 保留 那些 古老 的 WAL 日 志 (因为 不 确定 从 属 
服务 器 是 否 已 经 消费 这 部 分 WAL， 所 以 不 能 删 ) ， 从 而 导致 磁盘 空间 被 占 满 ， 最 后 导致 
服务 器 重启 。 











流 式 复制 





流 式 复制 模式 下 ，WAL 日 志 并 不 是 通过 直接 复制 文件 的 方式 从 主 服务 器 传递 到 从 属 服 
务 器 ， 而 是 通过 基于 PostgreSQL 内 部 协议 的 消息 来 传递 的 。 











级 联 复制 


一 个 从 属 服 务 器 可 以 把 WAL 日 志 传 递 给 另 一 个 从 属 服 务 器 ， 而 不 需要 所 有 的 从 属 服务 
器 都 从 主 服务 器 取 WAL 日 志 ， 这 进一步 减轻 了 主 服务 器 的 负担 。 这 种 模式 下 ， 有 的 从 
属 服务 器 可 以 作为 同步 的 数据 源 ， 从 而 继续 向 别 的 从 属 服务 器 传播 WAL 数据 ， 从 这 个 
角度 看 ， 其 作用 类 似 于 主 服 务 器 。 注 意 ， 这 种 扮演 着 “WAL 日 志 二 传 手 ”角色 的 从 属 
服务 器 是 只 读 的 ， 它 们 也 被 称 为 级 联 从 属 服务 器 。 





























逻辑 复制 





这 是 PostgreSQL 10 新 支持 的 复制 功能 ， 通 过 该 功能 可 以 实现 仅 复制 若干 特定 的 表 ， 而 
无 须 复制 整个 PostgreSQL 服务 器 的 所 有 数据 ， 从 而 大 大 增加 了 复制 的 灵活 性 。 该 功能 
的 实现 依赖 于 一 个 名 为 逻辑 解码 (logic decoding) 的 机 制 ， 该 机 制 可 以 将 表 数 据 的 变更 
历史 从 WAL 日 志 中 以 一 种 易于 理解 的 格式 解析 出 来 ， 过 程 中 无 须 关 注 数据 库 WAL 日 
志 格 式 的 内 部 实现 细节 。 逻 辑 解码 机 制 从 PostgreSQL 9.4 开始 就 已 支持 ， 某 些 扩展 包 基 
于 它 实现 了 审计 和 复制 功能 。 使 用 逻辑 复制 功能 时 ， 需 要 用 到 CREATE PUBLICATION 和 
CREATE SUBSCRIPTION 这 两 个 DDL 语法 ， 前 者 表示 哪些 表 要 进行 复制 ， 后 者 表示 哪些 
PostgreSQL 服务 器 上 的 哪些 database 要 订阅 数据 。 


另外 请 注意 ， 要 使 用 该 功能 ， 需 要 把 wal_level 参数 的 值 设置 为 logical。 
具体 的 使 用 示例 可 以 参考 “Logical Replication in PostgreSQL 10” 这 篇 博客 文章 。 
































重新 选 主 


重新 选 主 是 指 从 所 有 的 从 属 服务 器 中 选择 一 个 并 将 其 身份 提升 为 主 服务 器 的 过 程 。 
PostgreSQL 9.3 引入 了 基于 流 消 息 复制 的 选 主 机 制 ， 该 模式 下 选 主 时 仅 依 靠 流 消息 ， 而 
不 再 需要 访问 WAL 日 志文 件 ， 同 时 从 属 服 务 器 也 不 需要 经 历 一 次 重新 复制 过 程 。 直 到 
9.4 版 为 止 ， 重 新 选 主 还 会 要 求 整个 数据 库 服 务 重启 一 次 ， 将 来 的 版 本 中 可 能 会 改进 这 
一 点 。 




















过 











PostgreSQL 的 复制 机 制 会 复制 所 有 事务 性 的 变更 ， 即 在 事务 内 发 生 的 一 切 都 可 以 被 复制 到 


从 节点 。PostgreSQL 中 所 有 的 DDL 操作 都 是 事务 性 的 ， 因 此 建 表 、 建 视图 、 








安装 扩展 包 


之 类 的 操作 都 是 可 被 复制 的 。 注 意 非 日 志 (unlogged) 表 上 的 插入 、 更 新 和 删除 操作 是 不 





记录 WAL 日 志 的 ， 因 此 这 些 操作 不 会 被 复制 。 前 画 








i 说 过 ， 安 装 扩展 包 的 行 





为 会 被 复制 ， 


所 以 当 在 主 节点 上 安装 扩展 包 时 ， 要 确保 从 节点 上 有 扩展 包 的 安装 包 ， 而 且 版 本 号 需要 和 
主 节点 一 致 ， 否 则 在 主 节 点 上 执行 CREATE EXTENSION 操作 会 失败 。 
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10.1.2 复制 机 制 的 演进 


PostgreSQL 的 复制 机 制 本 质 上 是 靠 WAL 日 志 在 主 从 市 点 间 传 递 来 实现 的 。 流 式 复制 要 求 
从 节点 的 操作 系统 以 及 CPU 位 数 (32/64 位 ) 必须 和 主 节 点 相同 。 虽 然 官方 并 不 强制 要 求 
主 备 节 点 上 的 PostgreSQL 软件 一 直 精 确 到 第 三 位 的 小 版 本 号 都 完全 相同 ， 但 我 们 建议 保证 
主 备 PostgreSQL 的 版 本 号 完全 相同 。 如 果 由 于 某 些 原因 无 法 保证 这 一 点 ， 建 议 确保 从 而 点 























的 PostgreSQL 小 版 本 号 高 于 主 节点 。 
对 复制 机 制 的 支持 在 以 下 PostgreSQL 版 本 中 不 断 演进 。 

















。 9.4 版 中 新 增 了 对 复制 槽 的 支持 。 所 谓 “ 复 制 槽 ”是 指 主 从 服务 器 之 间 的 一 种 契约 ， 该 








主 服务 器 删除 。 





契约 保证 了 在 从 属 服务 器 尚未 消费 到 相应 的 WAL 日 志 之 前 ， 这 部 分 WAL 日 志 不 会 被 


。 9.5 版 中 引入 了 若干 用 于 监控 复制 过 程 的 函数 ,详情 请 参 萎 官方 手册 中 的 “复制 进度 跟踪 


部 分 。 





。 9.6 版 中 支持 了 在 同步 模式 下 设置 多 个 同步 备 节 点 的 能 力 ， 目 的 是 为 了 提升 可 靠 性 。 
。 PostgreSQL 10 中 支持 了 原生 的 逻辑 复制 功能 ， 该 功能 使 得 仅 复 制 指定 的 若干 张 表 成 为 




















可 能 。 逻 辑 复 制 功 能 的 另 一 个 好 处 是 可 以 让 从 市 点 有 自己 专属 的 表 ， 这 些 表 不 参与 复 
制 ， 可 以 在 从 节点 上 对 其 进行 任意 修改 。 该 版 本 还 引入 了 “临时 复制 槽 ”的 概念 ， 通 过 
它 可 以 实现 创建 一 次 性 的 复制 槽 ， 一 旦 创建 者 会 话 退出 ， 则 该 复制 槽 会 自动 消失 。 当 通 



































过 pg_basebackup 对 整个 服务 器 进行 基础 备份 时 ， 该 功能 特别 有 用 。 








尽管 逻辑 复制 是 PostgreSQL 10 才 原生 支持 的 新 特性 ， 但 其 实 从 PostgreSQL 9.4 开始 用 
户 已 经 可 以 通过 开源 的 pglogical 扩展 包 来 实现 逻辑 复制 能 力 。 如 果 你 需要 在 不 同 的 
PostgreSQL 大 版 本 间 进 行 复制 ， 比 如 PostgreSQL 10 和 PostgreSQL 9.4~9.6 之 间 ， 可 以 
通过 在 两 端的 PostgreSQL 服务 器 上 都 安装 相应 版 本 的 pglogical 扩展 包 来 实现 。 如 需 

















原生 的 逻辑 复制 能 力 即 可 。 


10.1.3 第 三 方 复制 解决 方案 








在 PostgreSQL 10 和 将 来 的 新 版 本 间 进 行 逻辑 复制 ， 则 无 须 借助 pglogical， 直 接 使 用 


除了 PostgreSQL 自 带 的 复制 机 制 外 ， 还 有 很 多 第 三 方 提 供 的 复制 工具 ，Slony 和 Bucardo 
是 其 中 应 用 最 广泛 的 两 个 ， 而 且 都 是 开源 的 。 尽 管 PostgreSQL 原生 复制 机 制 在 每 个 版 本 中 











都 会 得 到 功能 强化 ， 但 Slony、Bucardo 以 及 其 他 第 三 方 工具 仍然 在 灵活 性 方 下 





i 有 着 原生 复 

















制 机 制 难以 比拟 的 优势 : 它们 支持 仅 复制 单个 database 或 者 单 张 表 ， 它 们 也 不 要 求 复制 的 
源 端 和 目的 端的 PostgreSQL 版 本 和 操作 系统 相同 ， 它 们 还 支持 多 主 复制 。 但 它们 也 有 缺 
点 : 两 个 工具 均 依赖 于 新 建 额外 的 触发 器 来 触发 复制 动作 ， 同 时 还 可 能 需要 在 被 复制 表 上 
增加 一 些 额 外 的 字段 ， 因 此 它们 对 系统 架构 有 一 定 的 侵入 性 ;并 且 它 们 一 般 不 支持 建 表 、 
安装 扩展 包 等 DDL 操作 的 同步 。 可 以 看 出 ， 这 些 第 三 方 解 决 方案 相 比 原生 复制 方案 需要 























更 多 的 人 工 干预 ， 比 如 建 触发 器， 为 表 加 字段 或 者 创建 额外 的 视图 ， 等 等 。 











我 们 强烈 建议 你 在 决定 使 用 哪 一 种 产品 之 前 参考 一 下 “Replication, Clustering, and Connection 





Pooling” 这 篇 文章 。 
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10.2 复制 环境 的 搭建 


本 证 将 介绍 搭建 用 于 针对 整个 PostgreSQL 服务 器 的 复制 环境 的 所 有 步骤 。 我 们 将 使 用 流 式 复 
制 模式 来 实现 ， 该 模式 基于 主 服务 器 和 从 属 服务 器 之 间 的 数据 库 连 接 来 进行 WAL 日 志 传 输 。 


10.2.1 主 服务 器 的 配置 
主 服 务 器 的 基本 配置 步骤 如 下 所 示 。 
(1) 创建 一 个 专用 于 复制 的 用 户 账号 。 


CREATE ROLE pgrepuser REPLICATION LOGIN PASSWORD 'woohoo'; 


(2) 在 postgresql.conf 中 设置 好 以 下 配置 项 。 也 有 一 种 无 须 直接 修改 配置 文件 的 方法 : 使 用 
ALTER SYSTEM set 参数 名 = 参数 值 来 修改 配置 项 值 ， 改 好 以 后 执行 SELECT pg_reload_ 
conf() 来 让 配置 生效 。 

listen addresses = * 
wal_level = hot_standby 
archive_mode = on 


max_wal_senders = 5 
wal_keep_segments = 10 


如 果 你 希望 基于 逻辑 复制 来 实现 部 分 表 的 复制 ， 那 么 要 将 wal_level 设置 为 logical。 
logical 模式 相 比 hot_standby 模式 会 记录 更 多 事务 日 志 ， 因 此 logical 模式 既 适 用 于 
整个 PostgreSQL 服务 器 复制 场景 ， 又 适用 于 指定 部 分 表 复 制 的 场景 。 


以 上 设置 在 PostgreSQL 官方 手册 的 “服务 器 配置 复制 ”一 节 中 有 详细 介绍 。 如 果 
主 从 服务 器 的 距离 很 远 ， 而 且 主 服务 器 上 的 事务 处 理 又 很 繁忙 ， 那 么 我 们 建议 把 wal_ 
keep_segments 参数 设 得 大 一 点 。 如 果 运 行 的 是 PostgreSQL 9.6 或 更 高 版 本 ， 应 该 将 
wal_level 设置 为 replica， 而 不 是 上 面 写 的 hot_standby。 为 了 后 向 兼容 ，PostgreSQL 
9.6 中 会 将 hot_standby 自动 当成 replica 处 理 。 


(3) 在 postgresql.conf 中 添加 archive_command 配置 指令 ， 或 者 用 ALTER SYSTEM 修改， 该 
参数 的 含义 是 WAL 日 志 的 保存 路 径 。 在 流 式 复制 模式 下 ， 该 配置 指令 中 的 目标 路 径 
可 设 定 为 任何 路 径 。 更 多 有 关 此 配置 指令 的 信息 ， 请 参见 PostgreSQL 官方 手册 中 的 
“PostgreSQL PGStandby 工具 介绍 ”一 市 。 






































在 Linux/Unix 上 ，archive_command 行 可 参照 如 下 格式 设 定 : 
archive_command = 'cp %p ../archive/%f' 
也 可 以 使 用 rsync 命令 替代 cp 以 实现 异地 归档 : 
archive_command = "rsync -av %p postgresQ192.168.0.10:archive/%f' 
在 Windows 上 可 按 如 下 形式 设 定 : 


archive_command = 'copy %p ..\\archive\\%f' 
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(4) 在 pg_hba.conf 文件 中 设置 一 条 权限 规则 ， 以 允许 从 属 服务 器 作为 复制 体系 中 的 客户 
端 连 到 主 服务 器 。 例 如 ， 以 下 这 条 规则 所 代表 的 含义 是 ， 允许 你 的 私有 网 络 中 某 台 
服务 器 上 一 个 名 为 pgrepuser 的 PostgreSQL 账号 连接 到 主 服务 器 ， 其 IP 地 址 范围 为 
192.168.0.1 到 192.168.0.254， 验 证 方式 为 基于 MD5 的 加 密 密 码 。 


host replication pgrepuser 192.168.0.0/24 md5 
(5) 重启 PostgreSQL 服务 来 让 所 有 配置 生效 。 
使 用 PostgreSQL 安装 路 径 下 的 bin 文件 夹 中 的 pg_basebackup 工具 ， 来 为 整个 PostgreSQL 
服务 器 创建 一 个 全 量 备份 。 备 份 结果 包含 指定 目录 下 的 全 量 数据 文件 的 副本 。 
使 用 pg_basebackup 工具 时 ， 如 果 加 上 了 --xLog-method-stream 参数 ， 则 会 把 所 有 
WAL 日 志 也 备份 下 来 ， 过 程 中 会 建立 一 个 数据 库 连 接 用 于 进行 WAL 复制 ， 如 果 加 上 
了 -R 参数 ， 则 会 自动 创建 一 个 用 于 恢复 的 配置 文件 。 

















在 PostgreSQL 10 中 ， 原 先 的 pg_xlog 目录 已 经 被 重 命名 为 pg_wal。 


在 下 面 的 例子 中 ， 我 们 登录 到 从 属 服务 器 并 针对 主 服务 器 (192.168.0.1) 做 了 一 次 流 式 
全 量 备份 : 
pg_basebackup -D /target_dir -h 192.168.0.1 \ 


--port=5432 --checkpoint=fast 
--XLog-method=stream -R 


如 果 你 是 为 了 实现 备份 的 目的 而 使 用 pg_basebackup， 那 么 可 以 使 用 先 打 TAR 包 再 做 压缩 
这 种 常见 输出 形式 ， 最 终 会 在 备份 目标 目录 下 为 每 个 表 空 间 生 成 一 个 tar.gz 文件 。 注 意 ， 
下 面 的 命令 行 中 的 -X 等 同 于 --xtlog-method。 由 于 流 式 日 志 不 支持 以 压缩 格式 备份 ， 所 以 
需要 把 取 日 志 的 方式 改 为 文件 传递 ， 命 令 行 如 下 : 


pg_basebackup -Z9 -D /target dir/ -h 192.168.0.1 -Ft -Xfetch 


除了 备份 全 量 数据 外 ， 我 们 一 般 还 会 将 WAL 日 志 也 纳入 备份 体系 中 。 为 了 实现 这 一 点 ， 
在 PostgreSQL 10 之 前 ， 需 要 使 用 pg_receivexlog 工具 来 获取 事务 日 志 ， 在 PostgreSQL 10 
以 及 之 后 的 版 本 中 ， 该 工具 被 改名 为 pg_recetivewaL。 只 需 为 该 工具 设置 一 个 定时 任务 ， 即 
可 实现 持续 地 导出 并 备份 事务 日 志 。 


10.2.2 为 从 属 服务 器 配置 全 量 复制 环境 


如 有 果 搭 建 的 是 逻辑 复制 环境 ， 请 忽略 本 节 内 容 。 建 议 从 属 服务 器 与 主 服 务 器 的 各 项 系统 配 
置 完全 相同 ， 这 会 为 你 减少 很 多 麻烦 ， 特 别 是 当 你 需要 搭建 一 套用 于 保障 系统 高 可 用 的 主 
备 倒 换 环境 时 ， 这 一 点 尤其 重要 。 此 外 ， 如 果 要 在 主 服务 器 上 安装 扩展 包 ， 那 么 从 节点 上 
必须 有 相应 扩展 包 的 二 进 制 安装 文件 ， 否 则 在 主 市 点 上 执行 CREATE EXTENSION 后 ， 从 布点 
上 执行 恢复 过 程 时 就 会 报错 。 从 属 服务 器 市 点 必须 能 够 处 理 主 服务 器 发 来 的 WAL 事务 日 
志 。 有 具体 配置 步骤 如 下 。 
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(新 建 一 个 数据 库 实 例 作 为 从 属 服务 器 ， 要 求 采用 与 主 服务 器 相同 的 PostgreSQL 版 本 
(最 好 是 小 版 本 号 也 完全 相同 )。 事 实 上 ，PostgreSQL 官方 并 不 要 求 主 服务 器 和 从 属 服 
务 器 的 PostgreSQL 软件 的 小 版 本 号 也 完全 相同 。 其 实 你 可 以 尝试 一 下 ， 看 看 在 不 一 样 
的 情况 下 是 否 能 够 配置 成 功 。 

(2) 关 闭 从 属 服务 器 的 PostgreSQL 服务 。 

(3) 使 用 pg_basebackup 导出 的 文件 覆盖 从 属 服务 器 上 的 相应 文件 。 

(4) 将 下 面 的 配置 设置 添加 到 postgresql.auto.conf 文件 中 。 


hot_standby = on 
max_connections = 20 #set to higher or equal to master 


(5) 从属 服务 器 的 侦 听 端口 不 必 与 主 服 务 器 一 样 ， 因 此 可 以 选择 在 postgresql.auto.conf ms 
postgresql.conf 中 更 改 端 口 ， 也 可 以 通过 其 他 特定 于 操作 系统 的 启动 脚本 进行 更 改 ， 这 
些 启动 脚本 会 在 启动 之 前 设置 PGPORT 环境 变量 

(6) 在 data 文件 夹 下 创建 一 个 名 为 recovery.conf 的 新 文件 ， 内 容 如 下 (注意 下 面 第 二 行 
要 修改 为 真实 的 主机 名 、IP 地 址 和 端口 )。 如 果 前 面 使 用 了 pg_basebackup 进行 全 量 导 

出 ， 那 么 该 文件 已 自动 生成 ， 只 需 手动 加 上 trigger_file 那 一 行 即 可 。 


standby_mode = 'on' 

primary_conninfo = 'host=192.168.0.1 port=5432 User=pgrepuser w 
password=woohoo appLication_name=repLical' 

trigger_file = 'failover.now' 


(7) 如 果 发 现 从 属 服务 器 处 理事 务 日 志 的 速度 较 慢 ， 跟 不 上 主 服务 器 产生 日 志 的 速度 ， 为 避 
免 主 服务 器 产生 积压 ， 你 可 以 在 从 属 服务 器 上 指定 一 个 路 径 用 于 缓存 暂 未 处 理 的 日 志 。 


请 在 recovery.conf 中 添加 如 下 一 个 代码 行 ， 该 代码 行 在 不 同 操作 系统 下 会 有 所 不 同 。 
Linux/Unix 下 : 
































二 
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restore_command = "cp %p ../archive/%f' 
Windows 下 : 
restore_command = 'copy %p ..\\archive\\%f' 


本 示例 中 ， 路 径 中 指定 的 archive 文件 夹 就 是 我 们 用 于 缓存 日 志 的 文件 夹 。 





10.2.3 动 流 复制 进程 


如 果 你 已 经 用 pg_basebackup 完成 了 数据 全 量 导 出 ， 那 么 请 查看 一 下 其 中 的 recovery.conf 
文件 的 内 容 ， 确 认 是 否 均 正常 ， 然 后 再 启动 从 属 服务 器 。 

此 时 所 有 主 从 属 服务 器 应 该 都 是 能 访问 的 。 主 服务 器 的 任何 修改 ， 包 括 安装 一 个 扩展 包 或 
者 是 新 建 表 这 种 对 系统 元 数据 的 修改 ， 都 会 被 同步 到 从 属 服务 器 。 从 属 服务 器 可 对 外 提供 
查询 服务 。 


如 果 和 希望 某 个 从 属 服务 器 脱离 当前 的 主 从 复制 环境 ， 即 此 后 以 一 台独 立 的 PostgreSQL 服 
务 器 身份 而 存在 ， 请 直接 在 其 data 文件 夹 下 创建 一 个 名 为 failover.now 的 空 文件 。 从 属 服 
务 器 会 在 处 理 完 当 前 接收 到 的 最 后 一 条 事务 日 志 后 停止 接收 新 的 日 志 ， 然 后 将 recovery. 
conf 改名 为 recovery.done。 此 时 从 属 服务 器 已 与 主 服务 器 彻底 解除 了 复制 关系 ， 此 后 这 人 台 
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PostgreSQL 服务 器 会 作为 一 台独 立 的 数据 库 服务 器 存在 ， 其 数据 的 初始 状态 就 是 它 作 为 从 
属 服务 器 时 处 理 完 最 后 一 条 事务 日 志 后 的 状态 。 一 旦 从 属 服务 器 脱离 了 主 从 复制 环境 ， 就 
不 可 能 再 切换 回 主 从 复制 状态 了 。 要 想 切 换 回 去 ， 必 须 按照 前 述 步 骤 一 切 从 零 开 始 。 


10.2.4 使 用 逻辑 复制 实现 部 分 表 或 者 部 分 database 的 复制 


PostgreSQL 10 支持 通过 逻辑 复制 能 力 实现 仅 复 制 部 分 表 或 者 整个 PostgreSQL 服务 器 上 的 
若干 database。 届 辑 复制 的 一 大 优势 是 支持 在 PostgreSQL 10 和 未 来 更 新 的 版 本 间 进 行 复 
制 ， 而 且 不 需要 主 从 市 点 的 操作 系统 和 硬件 架构 相同 。 例 如 ， 我 们 可 以 实现 一 台 Linux 的 
PostgreSQL 服务 器 与 一 台 Windows 的 PostgreSQL 服务 器 之 间 的 复制 。 


在 逻辑 复制 的 概念 体系 中 ， 数 据 提供 方 的 服务 器 被 称 为 “发 布 者 ”(publisher)， 数 据 接收 
方 的 服务 器 被 称 为 “订阅 者 ”(subscriber)。 在 发 布 者 服务 器 上 需 复 制 的 表 所 在 的 database 
中 执行 CREATE PUBLICATION， 即 可 将 待 复制 的 表 作为 数据 源 发 布 出 去 ， 在 订阅 者 服务 器 上 
要 接收 数据 的 database 中 执行 CREATE SUBSCRIPTION， 来 指定 要 从 哪个 发 布 者 服务 器 的 哪个 
数据 源 来 订阅 数据 。 逻 辑 复 制 的 主要 问题 在 于 它 不 支持 DDL 复制 ， 因 此 要 求 待 复制 的 表 
在 开始 复制 之 前 在 主 从 服务 器 都 必须 先 建 好 。 
假设 我 们 的 一 台 服 务 器 上 运行 着 两 个 PostgreSQL 10 服务 实例 ， 发 布 端 PostgreSQL 的 侦 听 
端口 是 5447， 订 阅 端 PostgreSQL 的 侦 听 端口 是 5448。 不 管 这 两 个 PostgreSQL 实例 是 运行 
在 同一 台 服 务 器 还 是 不 同 服务 器 上 ， 以 下 过 程 都 是 一 样 的。 在 二 者 之 间 搭 建 逻 辑 复 制 的 过 
程 如 下 。 
(1) 在 发 布 端 PostgreSQL 实例 上 确保 以 下 参数 已 配置 : 
SHOW wal_level 
如 果 显 示 的 值 不 是 logical， 那 么 请 使 用 以 下 命令 修改 : 


ALTER SYSTEM SET wal_level = logical; 
然后 重启 PostgreSQL 服务 。 


如 果 需 要 实现 级 联 复制 ， 即 订阅 端 服务 器 也 需要 作为 发 布 者 来 向 下 一 级 订阅 者 进行 发 
布 ， 那 么 在 订阅 端 服务 器 上 最 好 也 把 wal_level 配置 成 logical。 


(2) 在 订阅 端 服 务 器 上 的 目标 database 中 创建 待 复制 的 表 。 如 果 你 有 许多 表 要 复制 或 者 要 复 
制 发 布 端 某 个 database 的 所 有 表 ， 那 么 建议 你 使 用 pg_dump 将 待 复制 的 表 结 构 导 出 来 ， 
然后 拿 到 订阅 端 服 务 器 上 执行 。 例 如 ， 如 果 需 要 复制 postgresql_book 这 个 database， 通 
过 以 下 语句 可 以 导出 其 结构 : 


pg_dump -U postgres -p5447 -Fp --section pre-data --section post-data \ 
-f pub_struct.sqL postgresqL_book 


然后 用 psql 连接 到 订阅 端 服务 器 上 执行 前 面 导 出 的 脚本 ， 命 令 如 下 : 


CREATE DATABASE book_sub; 
\connect book_sub; 
\i pub_struct.sql 


(3) 然后 在 发 布 端 服务 器 上 针对 待 复制 的 database 创建 一 个 数据 源 。 我 们 在 这 个 例子 中 将 使 
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用 CREATE PUBLICATION 来 实现 对 某 个 database 中 所 有 表 的 复制 。 请 注意 ， 以 下 命令 针对 
将 来 在 此 database 中 建立 的 表 也 生效 ， 但 要 想 这 些 后 建 的 表 能 复制 成 功 ， 需 要 先 到 订阅 
端 服务 器 上 把 这 些 新 表 也 创建 一 下 : 


CREATE PUBLICATION full_db_pub 
FOR ALL TABLES; 











(4) 要 想 刚 刚 建立 的 发 布 数据 源 起 作用 ， 需 要 对 其 进行 订阅 消费 。 连 接 到 订阅 端 服务 器 上 的 
book_sub 这 个 database 中 ， 然 后 执行 以 下 命令 : 
\connect book_sub; 
CREATE SUBSCRIPTION book_sub 
CONNECTION 'host=localhost port=5447 dbname=postgresql_book \ 


user=postgres' 
PUBLICATION full_db_pub; 


以 上 命令 执行 完毕 后 ， 查 看 一 下 订阅 端 book_sub 库 中 的 表 ， 可 以 看 到 其 中 已 经 有 了 首次 同 
步 复制 过 来 的 数据 。 如 果 在 发 布 端的 postgresql_book 库 中 插入 新 的 记录 ， 可 以 看 到 book_ 
sub 中 已 经 复制 过 来 了 。 


如 果 不 再 需要 某 个 发 布 端 或 者 订阅 端 ， 可 以 使 用 DROP SUBSCRIPTION 和 DROP PUBLICATION 
删除 它们 。 


10.3 ”外 部 数据 封装 器 


外 部 数据 封装 器 (FDW) 是 PostgreSQL 提供 的 一 种 用 于 访问 外 部 数据 源 的 手段 ， 它 是 
可 扩展 的 ， 也 兼容 业界 标准 。 该 机 制 所 支持 的 外 部 数据 源 包 括 PostgreSQL 以 及 其 他 非 
PostgreSQL 数据 源 。FDW 的 核心 概念 是 “外 部 表 ”， 这 种 表 看 起 来 和 当前 PostgreSQL 中 
其 他 表 的 用 法 完全 相同 ， 但 事实 上 其 数据 本 体 是 存在 于 外 部 数据 源 中 的 ， 该 数据 产 甚 至 可 
能 存在 于 另外 一 台 物 理 服务 器 上 。 一 旦 定义 好 了 外 部 表 ， 其 定义 就 会 在 当前 数据 库 中 持 
入 化 ， 你 就 可 以 放心 地 与 使 用 普通 表 一 样 使 用 它 ，FDW 完全 屏蔽 了 与 外 部 数据 源 之 间 的 
复杂 通信 过 程 。 比 较 流 行 的 FDW 及 其 用 法 示例 可 以 通过 PostgreSQL FDW 维基 百科 页 面 
查 到 。 可 以 通过 PGXN FDW 页 面 和 PGXN Foreign Data Wrapper 页 面 查 到 PostgreSQL 的 
FDW 目录 。 在 GitHub 上 搜索 “PostgreSQL Foreign Data Wrappers”， 可 以 搜索 到 前 述 很 多 
FDW 的 源码 ， 另 外 还 能 找到 一 些 不 在 前 述 列 表 中 的 EDW。 如 果 你 需要 自行 封装 某 个 外 部 
数据 源 ， 那 么 请 先 到 前 面 提供 的 这 些 站 点 中 查询 一 下 别人 是 否 已 实现 ， 如 果 没 有 ， 再 自己 
做 。 如 果 封 装 成 功 ， 请 记得 发 布 出 来 与 社区 分 享 。 

大 多 数 PostgreSQL 安装 包 会 默认 携带 两 个 FEDW: file_fdw 和 postgres_fdw， 但 默认 设 有 
安装 ， 你 可 以 执行 CREATE EXTENSION 来 安装 它们 。 

直到 PostgreSQL 9.2 为 止 ， FDW 仅 支 持 对 外 部 表 进 行 查 询 。PostgreSQL 9.3 中 引入 了 一 组 新 的 
API， 实 现 了 对 外 部 表 的 修改 。 但 PostgreSQL 自 带 的 FDW 中 只 有 postgres_fdw 支持 此 特性 。 
本 节 中 ， 我 们 将 向 你 演示 如 何 注册 外 部 服务 器 、 外 部 用 户 以 及 外 部 表 ， 最 后 介绍 如 何 查询 
外 部 表 。 我 们 使 用 的 例子 中 都 使 用 SQL 命令 行 来 创建 和 删除 对 象 ， 你 也 可 以 通过 pgAdmin 
的 图 形 化 界面 工具 来 实现 相同 的 操作 。 
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10.3.1 查询 平面 文件 
可 以 使 用 file_fdw 这 个 FDW 来 查询 平面 文件 ， 它 是 以 扩展 包 的 形式 存在 的 ， 因 此 可 以 通 
过 以 下 SQL 安装 : 

CREATE EXTENSION file_fdw; 


尽管 通过 file_fdw 可 以 直接 读 取 数据 库 实例 所 在 的 本 地 服务 器 上 的 文件 ， 但 为 了 和 别 的 
FDW 在 语义 上 保持 一 致 ， 还 是 得 定义 一 个 逻辑 上 的 外 部 服务 器 。 请 执行 以 下 命令 来 定义 
一 个 “ 伪 ” 外 部 服务 器 : 

CREATE SERVER my_server FOREIGN DATA WRAPPER file_fdw; 


接 下 来 要 注册 外 部 表 。 你 可 以 将 外 部 表 置 于 任何 一 个 schema 中 ， 但 我 们 一 般 是 创建 一 个 
单独 的 schema 来 容纳 所 有 的 外 部 表 。 接 下 来 将 使 用 一 个 名 为 staging 的 schema， 如 示例 
10-1 所 示 。 


这 里 先 列 出 几 行 我 们 将 要 访问 的 外 部 文件 的 内 容 ， 每 一 行内 的 字段 用 管道 符 分 隔 ， 格 式 如 下 : 


Dev|Company 
Tom Lane|Crunchy Data 
Bruce Momjian|EnterpriseDB 


示例 10-1 定义 基于 分 隔 符 格式 文件 的 外 部 表 
CREATE FOREIGN TABLE staging.devs (developer VARCHAR(150), company VARCHAR(150)) 
SERVER my_server 
OPTIONS ( 
format 'csv', 
header 'true', 
filename '/postgresql_book/ch10/devs.psv', 
delimiter'|', 
nuLL' 















































); 
上 面 的 示例 中 ， 尽 管 外 部 表 映 射 到 一 个 用 管道 符 作为 分 隔 符 的 平面 文件 ， 但 我 们 依然 将 其 
标识 为 “csv” 格 式 。 有 人 可 能 会 根据 CSV (comma seperated values) 的 名 称 认为 只 有 用 过 
号 作为 分 隔 符 的 文件 才能 称 为 CSV， 但 在 FDW 的 术语 体系 中 ，CSYV 文件 就 是 以 某 种 分 隔 
符 来 区 分 列 值 的 平面 文件 ， 不 管 这 个 分 隔 符 具体 是 什么 字符 ， 都 可 以 称 之 为 CSV。 
上 述 定义 步骤 完成 后 ， 你 就 可 以 直接 通过 SQL 访问 外 部 表 了 : 

SELECT * FROM staging.devs WHERE developer LIKE 'T%'; 
如 果 不 再 需要 此 外 部 表 ， 可 以 删 掉 : 


DROP FOREIGN TABLE staging.devs; 


10.3.2 ”以 不 规则 数组 的 形式 查询 不 规范 的 平面 文件 

通常 ， 平 面 文件 在 每 一 行 中 会 有 许多 不 同 的 列 ， 并 且 包 含 多 个 标题 行 和 页 脚 行 。 我 们 最 嘉 
欢 使 用 file_textarray_fdw 这 个 FDW 来 处 理 这 种 非 结构 化 平面 文件 。 该 FDW 能 处 理 任 
何 带 分 隔 符 的 平面 文件 ， 即 使 每 一 行 中 的 元 素数 量 不 一 臻 也 设 问 题 ， 因 为 它 可 以 将 每 一 行 
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作为 一 个 变 长 的 文本 数组 (text[]) 来 进行 处 理 。 


问题 是 file_textarray_fdw 不 是 PostgreSQL 原生 支持 的 扩展 包 ， 因 此 你 必须 手动 编译 安 
装 它 。 首 先 ， 在 安装 PostgreSQL 时 需要 附带 安装 系统 头 文件 ， 以 便于 后 续 的 编译 。 然 后 
从 Adunstan GitHub 这 个 站 点 下 载 file_textarray_fdw 的 源码 。 请 注意 : 该 站 点 为 每 个 
PostgreSQL 版 本 都 准备 了 相应 的 源码 ， 请 确保 选择 的 是 正确 的 版 本 。 在 编译 完成 后 ， 请 将 
它 以 扩展 包 的 形式 安装 好 ， 该 过 程 与 前 面 介绍 过 的 安装 其 他 FDW 的 过 程 完全 相同 。 

如 果 你 的 环境 是 Linux/Unix， 只 要 安装 了 postgresql-dev 这 个 包 ， 那 么 编译 过 程 是 很 简 
单 的 ， 但 在 Windows 上 就 比较 麻烦 ， 所 以 我 们 已 经 为 你 编译 好 了 安装 包 ， 你 可 以 从 以 
下 几 个 链接 中 选择 合适 的 版 本 下 载 。Windows 32/64 位 适 配 PostgreSQL 9.4: http://www. 
postgresonline.com/journal/archives/340-Foreign-Data-Wrappers-for-PostgreSQL-9.4-Windows. 
htmlhttp:/bit.ly/2o0RDY6X。Windows 32/64 位 适 配 PostgreSQL 9.5 和 PostgreSQL 9.6: http:// 
www.postgresonline.com/journal/archives/361-Foreign-Data-Wrappers-for-PostgreSQL-9.5- 



































windows.html。 


FDW 安装 好 以 后 ， 首 先 创建 扩展 包 。 


CREATE EXTENSION file_textarray_fdw; 


然后 就 跟 安 装 其 他 FDW 时 一 样 ， 创 建 好 外 部 服务 器 。 


CREATE SERVER fiLLe_taserver FOREIGN DATA WRAPPER file textarray_fdw; 


然后 设置 外 部 表 。 可 以 将 外 部 表 放 入 任何 一 个 你 认为 合适 的 schema 中 。 在 示例 10-2 中 ， 
我 们 将 再 次 使 用 前 面 用 过 的 staging schema。 


示例 10-2 ”创建 一 个 基于 文本 数组 的 外 部 表 
CREATE FOREIGN TABLE staging.factfinder_array (x text[]) 
SERVER fiLLe_taserver 
OPTIONS ( 
format 'csv', 
filename '/postgresql_book/ch10/DEC_10_SF1_QTH1_with_ann.csv', 
header 'false', 
delimiter ',', 
quote '"', 
encoding "Latin1 ' ， 
nuULL 























); 
假设 我 们 要 处 理 这 样 一 个 CSV 文件 : 文件 中 含有 8 个 标题 行 ， 而 列 数 多 得 我 们 不 想 数 。 
当前 述 设置 步骤 都 完成 后 ， 就 可 以 直接 查询 这 个 文件 的 内 容 了 。 通 过 以 下 查询 可 以 得 到 标 
题 行 的 名 称 ， 这 些 标题 行 的 第 一 个 列 标 头 为 GE0.td。 

SELECT unnest(x) FROM staging.factfinder_array WHERE x[1] = 'GE0.id' 
以 下 查询 能 查 出 数据 的 前 两 列 。 


SELECT x[1] As geo_id, x[2] As tract_id 
FROM staging.factfinder_array WHERE x[1] ~ '[0-9]+'; 
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10.3.3 ”查询 其 他 PostgreSQL 服 务实 例 上 的 数据 
从 9.3 版 开始 ， 大 多 数 的 PostgreSQL 发 行 包 都 包含 了 postgres_fdw 这 个 FEDW。 通 过 它 还 
可 以 对 其 他 PostgreSQL 服务 器 上 的 数据 进行 读 取 和 修改 操作 ， 哪 人 两 边 的 PostgreSQL 版 
本 不 一 臻 也 没关系 。 
首先 也 是 要 进行 FDW 扩展 包 的 安装 。 

CREATE EXTENSION postgres_fdw; 
然后 创建 外 部 服务 器 。 

CREATE SERVER book_server 

FOREIGN DATA WRAPPER postgres_fdw 

OPTIONS (host 'localhost', port '5432', dbname 'postgresql_book'); 
如 果 创 建 好 外 部 服务 器 后 需要 更 改 连 接 选 项 或 将 其 添加 到 外 部 服务 器 ， 则 可 以 使 用 ALTER 
SERVER 命令 。 比 如 ， 如 果 需 要 更 改 你 所 指向 的 服务 器 ， 可 以 执行 以 下 代码 行 。 


ALTER SERVER book_server OPTIONS (SET host 'prod'); 























对 于 主机 、 端 口 和 database 这 几 项 的 连接 设置 的 更 改 只 对 新 建立 的 会 话 生 
效 ， 不 会 影响 已 有 的 会 话 。 原 因 是 会 话 在 开始 时 建立 ， 此 后 就 一 直 复 用 ， 而 
` 会 断 开 重 连 。 




















然后 创建 一 个 用 户 映射 关系 ，， 将 远 端 的 某 个 角色 映射 到 本 地 的 public 角色 。 


CREATE USER MAPPING FOR public SERVER book_server 
OPTIONS (user 'role_on _ foreign', password 'your_password'); 


注意 ， 上 述 映射 关系 中 的 远 端 角色 必须 是 一 个 已 存在 的 角色 ， 并 且 有 登录 权限 。 这 样 任何 
能 连 到 本 地 数据 库 的 用 户 都 可 以 连 到 远 端 数据 库 。 


现在 可 以 创建 外 部 表 了 。 该 表 可 以 映射 远 端 表 的 全 部 或 部 分 列 。 在 示例 10-3 中 ， 我 们 创建 
了 一 个 外 部 表 ， 映 射 到 远 端 数据 库 上 的 censu.facts 表 。 


示例 10-3 ”定义 一 个 映射 到 远 端 PostgreSQL 数据 库 的 外 部 表 
CREATE FOREIGN TABLE ft_facts ( 
fact_type_id int NOT NULL， 
tract_id varchar(11) ， 
yr int, val numeric(12,3), 
perc numeric(6,2) 








) 


SERVER book_server OPTIONS (schema_name 'census', table name 'facts'); 
上 面 的 示例 仅 包含 外 部 表 的 最 基本 的 选项 。 默 认 情 况 下 ， 映 射 到 远 端 PostgreSQL 数据 库 的 
外 部 表 都 是 可 更 新 的 ， 当 然 前 提 是 映射 关系 中 所 使 用 的 远 端 数据 库 角 色 对 映射 的 远 端 表 要 
有 修改 权限 。 该 updatable 设置 是 一 个 布尔 设置 ， 可 以 在 定义 外 部 表 或 者 外 部 服务 器 时 进 
































注 1: 所 谓 “ 用 户 映 射 ”是 指 在 远 端 服务 器 的 某 个 角色 和 本 地 服务 器 的 某 个 角色 之 间 建 立 对 应 关系 ， 这 样本 
地 角色 可 以 用 远 端 角色 的 权限 来 操作 远 端 服务 器 上 的 数据 。 一 一 译 者 注 
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行 更 改 。 例 如 ， 如 果 想 把 外 部 表 设 定 为 只 读 ， 可 以 执行 以 下 代码 行 。 
ALTER FOREIGN TABLE ft_facts OPTIONS (ADD updatable 'false'); 
要 将 表 设 置 回 updatable 状态 ， 请 执行 以 下 代码 行 。 
ALTER FOREIGN TABLE ft_facts OPTIONS (SET updatable 'true' ); 
表 级 别 上 的 updatable 属性 会 替代 外 部 服务 器 设置 。 


ALTER FOREIGN TABLE 语句 除了 可 以 更 改 0PTIONS 之 外 ， 还 可 以 添加 或 者 删除 列 ， 语 法 是 
ALTER FOREION TABLE .. DROP COLUMN, 


PostgreSQL 9.5 中 引入 了 对 IMPORT FOREIGN SCHEMA 命令 的 支持 ， 它 可 以 实现 外 部 表 的 
自动 创建 ， 从 而 为 用 户 节省 大 量 时 间 。 不 过 请 注意 ， 并 不 是 所 有 的 FDW 都 支持 IMPORT 
FOREIGN SCHEMA 能 力 。 每 个 FDW 在 执行 外 部 表 结 构 导 入 时 都 可 以 设置 一 些 服务 端 参数 。 
对 于 postgres_fdw 来 说 ， 支 持 的 参数 如 下 。 

import_collate 


是 否 将 远 端 PostgreSQL 服务 器 上 的 字符 排序 规则 设置 也 导入 到 本 地 外 部 表 。 默 认为 


true。 








import_default 
是 否 将 远 端 PostgreSQL 服务 器 上 的 字段 默认 值 属性 也 导入 到 本 地 外 部 表 中 。 默 认为 
false， 即 本 地 服务 器 上 的 外 表 字 段 上 没有 默认 值 。 当 要 对 外 表 进 行 数据 插入 操作 时 ， 
默认 值 是 有 用 的 : 如 果 Insert 语句 中 未 包括 茶 字 段 ， 则 插入 结果 中 会 取 该 字段 的 默认 
值 ， 因 此 理论 上 应 该 要 把 默认 值 信息 复制 过 来 。 但 有 一 点 请 特别 注意 : 如 果 该 字段 的 默 
认 值 是 基于 一 个 序列 号 生成 器 的 自动 递增 值 ， 则 其 效果 未 必 符 合 你 的 预期 ， 因 为 本 地 服 
务 器 上 得 到 的 序列 号 和 远 端 服务 器 上 得 到 的 序列 号 完全 可 能 不 一 样 。 


import_not_nuLL 


是 否 将 远 端 PostgreSQL 服务 器 上 的 字段 NOT NULL 属性 导入 到 本 地 外 部 表 中 。 默 认为 


true。 


在 示例 10-4 中 ， 我 们 将 远 端 PostgreSQL 服务 器 上 books.public 这 个 schema 中 的 所 有 表 结 
构 导 入 本 地 服务 器 并 自动 生成 了 外 部 表 。 

示例 10-4 使 用 IMPORT FOREIGN SCHEMA 命令 来 导入 一 个 schema 中 的 所 有 表 结 构 

CREATE SCHEMA remote_census; 

IMPORT FOREIGN SCHEMA public 

FROM SERVER book_server 


INTO remote_census 
OPTIONS (import_default 'true'); 


如 上 例 10-4 所 示 ，IMPORT FOREIGN SCHEMA 命令 会 为 外 部 schema 中 的 每 张 表 在 本 地 的 
remote_census Schema 中 创建 一 张 同 名 的 外 部 表 。 


如 果 只 想 导 入 部 分 表 ， 可 以 使 用 LIMIT T0 或 者 EXCEPT 子 句 。 例 如 ， 如 果 只 希望 导入 facts 
和 Lu_fact_type 这 两 张 表 ， 可 以 这 么 写 : 
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IMPORT FOREIGN SCHEMA census 
LIMIT TO (facts, lu_fact types) 
FROM SERVER book_server INTO remote_census; 
如 果 LIMIT TO 后 面 指定 的 表 在 远 端 PostgreSQL 服务 器 上 不 存在 ， 系 统 会 直接 忽略 掉 ， 不 
会 报错 。 我 们 建议 在 执行 完 导入 外 部 表 操 作 后 进行 一 次 检查 ， 以 确保 所 有 你 希望 导入 的 表 
的 确 均 已 导入 成 功 。 


EXCEPT 与 LIMIT TO 用 法 类 似 ， 只 不 过 二 者 效果 正好 相反 : EXCEPT 用 于 指定 哪些 表 不 要 导 
入 ; LIMIT T0 用 于 指定 哪些 表 要 导入 。 


如 果 你 在 PostgreSQL 系统 中 使 用 了 一 些 扩展 包 提供 的 能 力 ， 那 么 可 能 需要 用 到 外 部 服务 器 
的 一 个 新 参数 ， 该 参数 名 为 extensions， 是 PostgreSQL 9.6 中 引入 的 ， 它 可 以 用 来 提升 外 
部 服务 器 的 访问 性 能 。 要 想 用 上 此 特性 ， 请 按 如 下 语法 为 现 有 的 postgres_fdw 外 部 服务 器 
进行 参数 设置 : 
ALTER SERVER census(OPTION ADD extensions 'btree gist, pg_trgm'); 

这 个 extensions 参数 的 内 容 是 一 个 用 逗号 分 隔 的 扩展 包 列 表 ， 它 表示 远 端 PostgreSQL 服 
务 器 上 已 经 安装 了 哪些 扩展 包 。 当 PostgreSQL 要 执行 的 语句 的 WHERE 条 件 中 涉及 扩展 
包 中 定义 的 数据 类 型 或 者 函数 时 ， 系 统 会 尝试 将 这 些 函 数 调用 推送 到 远 端 服务 器 上 去 执 
行 ， 这 样 性 能 就 得 以 提升 。 如 果 未 设置 extensions 参数 ， 所 有 扩展 包 中 的 函数 都 不 得 不 在 
本 地 服务 器 上 执行 ， 这 就 意味 着 需要 先 把 所 有 相关 的 数据 从 远 端 服务 器 上 传输 到 本 地 ， 从 
而 大 大 地 增加 了 要 通过 网 络 传输 的 数据 量 ， 速 度 自然 也 会 受 影响 。 


10.3.4 ”使 用 ogr_fdw 查 询 其 他 二 维 表 形式 的 数据 源 

有 许多 FDW 可 以 用 来 查询 其 他 关系 型 数据 库 或 者 平面 文件 数据 ， 其 中 大 多 数 都 仅 支持 某 种 
特定 类 型 的 数据 源 。 例 如 ， 有 专门 用 于 查询 MongoDB 数据 的 MongoDB FDW， 有 专门 用 于 
查询 Hadoop 数据 源 的 Hadoop FPPW， 也 有 专门 用 于 查询 MySQL 数据 源 的 MySQL FDW。 
我 们 知道 有 两 种 FDW 能 够 支持 多 种 数据 源 。 第 一 个 是 Multicorn FDW， 它 事实 上 是 一 种 
支持 用 户 以 Python 语言 编写 自 定 义 FDW 的 FDW API 平 台 。 已 经 有 一 些 基于 Multicorn 
FDW 平台 的 FDW 可 用 ， 但 该 平台 不 支持 Windows 而 且 在 Linux 上 用 起 来 也 问题 很 多 ,要 
想 用 好 需要 一 些 技巧 。 


另 一 个 支持 多 种 数据 源 的 FDW 就 是 ogr_fdw， 本 节 将 详细 展示 它 的 用 法 。ogr_fdw 支持 很 
多 二 维 表 形 式 的 数据 源 ， 例 如 电子 表格 (比如 Excel 或 者 LibreOffice 等 ) 软件 使 用 的 表 
单 、Dbase 文件 、CSYV 文件 以 及 其 他 关系 型 数据 库 等 。 另 外 ， 它 还 支持 空间 数据 ， 可 以 从 
SQL Server、Oracle 等 关系 型 数据 库 把 数据 导入 到 PostGIS 并 转换 为 PostgreSQL 几何 类 型 。 
有 些 PostGIS 的 安装 包 中 同时 也 会 附带 提供 ogr_fdw 扩展 包 。 例 如 ，EnterpriseDB 公司 
的 StackBuilder 安装 工具 中 提供 的 Windows 版 PostGIS 包 里 面 就 附带 提供 了 ogr_fdw; 在 
CentOS 和 红 帽 Linux 企业 版 (RHEL) 操作 系统 中 ， 使 用 yum 一 站 式 安 装 工 具 从 yum. 
postgresql.org 站 点 也 能 获取 到 ogr_fdw; 在 BigSQL 公司 提供 的 PostgreSQL 发 行 版 安装 包 中 
也 提供 了 ogr_fdw。 如 果 你 希望 根据 自行 编译 安装 ogr_fdw， 可 以 从 GitHub 上 下 载 到 源码 。 


从 内 部 实现 机 制 来 看 ，ogr_fdw 其 实 是 利用 了 “地 理 空 间 数据 抽象 层 库 ” (Geospatial Data 
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Abstraction Library，GDAL) 来 实现 上 述 强 大 功能 。 因 此 ， 在 编译 或 者 使 用 ogr_fdw 之 前 ， 
需要 先 编译 并 安装 好 GDAL 库 。GDAL 库 历史 悠久 、 功 能 特性 繁多 ， 因 此 根据 不 同 的 编译 
选项 可 以 编译 出 多 种 多 样 的 能 力 组 合 。 因 此 请 注意 : 你 的 GDAL 库 和 我 的 GDAL 库 有 可 
能 差别 很 大 。GDAL 一 般 是 作为 PostGIS 的 一 部 分 随 之 安装 ， 所 以 为 了 确保 在 使 用 GDAL 
的 过 程 中 不 会 遇 到 什么 问题 ， 我 们 建议 安装 最 新 版 本 的 PostGIS 。 

GDAL 库 安 装 好 以 后 ， 一 般 都 自 带 对 Excel 表格 、LibreOffice Calc 表格 、ODBC 数据 源 、 
空间 数据 Web 服务 数据 源 的 支持 。 在 Windows 上 它 一 般 还 会 支持 Microsoft Access 数据 
源 ， 但 在 Linux/Mac 下 一 般 不 会 支持 。 


安装 好 ogr_fdw 的 二 进 制 安装 包 以 后 ， 连 到 PostgreSQL 上 要 安装 ogr_fdw 的 database， 然 
后 执行 以 下 命令 即 可 : 
CREATE EXTENSION ogr_fdw; 

由 于 ogr_fdw 支持 多 种 多 样 的 外 部 数据 源 ， 因 此 针对 不 同 的 数据 源 来 说 ， 外 部 服务 器 的 含 
义 也 是 不 一 样 的 。 比 如 对 于 CSYV 文件 来 说 ，CSYV 文件 所 在 的 目录 就 对 应 于 外 部 服务 器 ， 
该 目录 下 的 每 个 CSV 文件 对 应 于 一 张 独 立 的 外 表 ; 对 于 Microsoft Excel 和 LibreOffice Calc 
来 说 ,一 张 工 作 表 就 对 应 于 一 个 外 部 服务 器 ， 这 张 工 作 表 中 的 每 一 张 表单 就 对 应 于 一 个 独 
立 的 外 表 ; 对 于 SQLite 数据 库 来 说 ， 一 个 database 就 对 应 于 一 个 外 部 服务 器 ， 其 中 的 每 一 
张 表 就 对 应 一 个 独立 的 外 表 。 


在 下 面 的 例子 中 ， 我 们 把 一 个 LibreOffice 工作 表 映 射 为 一 个 外 部 服务 器 ， 把 其 中 的 表单 映 
射 为 独立 的 外 表 : 
CREATE SERVER ogr_fdw_wb 
FOREIGN DATA WRAPPER ogr_fdw 
OPTIONS ( 
datasource '/fdw_data/Budget2015.ods ' ， 
format "0DS ' 
); 


CREATE SCHEMA wb_data; 
IMPORT FOREIGN SCHEMA ogr_all 
FROM SERVER ogr_fdw_wb INTO wb_data; 


上 面 的 ogr_all 是 一 个 用 来 泛 指 所 有 schema 的 代称 而 非 真实 的 schema 名 ， 它 代 指 了 数据 
源 中 所 有 的 schema， 其 作用 是 将 数据 源 中 所 有 的 表 全 部 导入 ， 不 管 表 属 于 哪个 schema。 
值得 注意 的 一 点 是 ， 有 的 外 部 数据 源 有 schema 概念 而 有 的 数据 源 没 有 。 为 了 适应 各 种 数 
据 源 ， 当 数据 源 不 提供 schema 概念 时 ，ogr_fdw 可 以 接受 一 个 虚拟 的 schema 名 〈 填 在 上 
例 中 ogr_all 出 现 的 位 置 )， 这 个 虚拟 schema 名 其 实 是 表 名 前 级 ， 也 就 是 说 ， 所 有 名 字符 
合 此 前 绥 的 表 都 被 认为 属于 该 虚拟 的 schema， 从 而 可 以 被 一 次 性 导入 。 例 如 ， 如 果 和 希望 一 
次 性 把 所 有 名 字 以 “Finance” 开 头 的 表单 导入 进来 ， 那 么 可 以 把 上 面 脚本 中 的 ogr_all 替 
换 为 “Finance”: 
CREATE SCHEMA wb_data; 


IMPORT FOREIGN SCHEMA "Finance" 
FROM SERVER ogr_fdw wb INTO wb_data; 


schema 的 名 字 是 区 分 大 小 写 的 ， 因 此 如 果 表 单 的 名 字 中 含有 大 写字 符 或 者 非 标准 字符 ， 需 
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要 在 其 前 后 加 引号 。 


下 一 个 例子 是 对 一 个 存 有 CSYV 文件 的 目录 创建 外 部 数据 源 服务 器 。 创 建 一 个 名 为 ff 的 
schema 来 容纳 外 部 表 。ogr_fdw 会 在 ff 这 个 schema 中 自动 针对 每 个 名 字 以 Housing 开头 
的 CSV 文件 创建 外 表 。 脚 本 如 下 : 

CREATE SERVER ogr_fdw ff 

FOREIGN DATA WRAPPER ogr_fdw 

OPTIONS (datasource '/fdw_data/factfinder', format 'CSV'); 

CREATE SCHEMA ff; 


IMPORT FOREIGN SCHEMA "Housing" 
FROM SERVER ogr_fdw ff INTO ff; 


假设 在 上 例 的 目录 中 有 Housing_2015.csv 和 Housing_2016.csv 这 两 个 文件 ， 那 么 系统 会 为 
它们 在 schema ff 中 各 建 一 个 外 表 ， 表 名 为 housing_2015 和 housing_2016 。 


ogr_fdw 默认 会 对 外 部 数据 源 中 的 表 名 和 字段 名 进行 转换 : 所 有 大 写 的 表 名 和 字段 名 都 会 
被 修改 为 小 写 。 如 果 你 不 希望 发 生 这 种 转换 ， 可 以 在 IMPORT FOREIGN SCHEMA 命令 中 加 上 
一 些 参数 ， 来 使 得 外 部 数据 源 的 表 名 和 字段 名 维持 原样 不 变 。 例 如 : 

IMPORT FOREIGN SCHEMA "Housing" 


FROM SERVER ogr_fdw_ff INTO ff 
OPTIONS(Launder_tabLe_names 'false', launder_column_names 'false'); 


这 个 语句 创建 出 来 的 外 表 名 就 是 Housing_2015 和 Housing_2016， 与 外 部 数据 源 中 的 原始 表 
名 保持 一 致 。 


10.3.5 ”查询 非 传统 数据 源 


长 久 以 来 ， 数据库 界 多 元 化 的 趋势 有 增 无 减 ， 各 种 架构 大 相 径 庭 的 数据 库 如 雨 后 春 算 般 层 
出 不 穷 ， 要 想 紧 跟 业 界 潮流 十 分 困难 。 这 些 异彩 纷呈 的 数据 库 中 ， 有 的 只 是 野花 一 现 ， 喧 
闸 一 阵子 就 消失 无 踪 ， 有 的 立志 要 将 传统 的 关系 型 数据 库 挑 落马 下 ， 更 有 另类 者 其 至 看 起 
来 根本 就 不 像 是 数据 库 。FDW 功能 的 引入 就 是 PostgreSQL 对 这 一 百花 齐 放 局 面 的 应 对 策 
略 之 一 。 不 管 外 界 如 何 风 云 变 幻 ，PostgreSQL 无 须 改变 自身 的 核心 功能 ， 而 是 通过 FDW 
搭建 与 这 些 异 构 数据 库 之 间 沟 通 的 桥梁 。 

在 下 面 的 例子 中 ， 我 们 将 展示 如 何 使 用 ww_fdw 来 查询 来 自 Web 服务 的 数据 。 该 示例 是 从 
www_fdw Examples 站 点 借鉴 而 来 的 。 

PostgreSQL 发 行 包 是 不 附带 www_fdw 的 ， 因 此 需要 自行 编译 安装 。 如 果 你 使 用 的 是 Linux/ 
Unix 环境 并 且 已 安装 了 postsql-dev 这 个 包 ， 那 么 编译 是 很 容易 的 。 请 从 https://github. 
comy/cyga/www_fdw 下 载 最 新 版 本 的 www_fdw 源码 。 对 于 Windows 平台 来 说 ， 我 们 已 经 赫 
你 编译 好 了 ， 下 载 链接 如 下 : 

Windows-32 9.1 (http://www.postgresonline.com/downloads/fdw_win32_91_bin.zip) 













































































Windows-64 9.3 (http://www.postgresonline.com/downloads/fdw_win64_93_bin.zip) 
首先 安装 FDW 扩展 包 。 


CREATE EXTENSION www_fdw; 
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然后 创建 针对 Google Web 服务 的 外 部 服务 器 。 


CREATE SERVER www_fdw_server_google_search 
FOREIGN DATA WRAPPER www_fdw 
OPTIONS(uri 'http://ajax.googleapis.com/ajax/services/search/web?v=1.0'); 


www_fdw 默认 支持 JSON 格式 数据 产 ， 因 此 我 们 不 需要 在 上 述 语句 的 OPTIONS 修饰 符 中 特地 声 
明 数 据 源 格式 。 此 外 ww_fdw 还 支持 XML 格式 数据 源 。 如 有 果 想 了 解 ww_fdw 所 支持 的 形 参 的 
详细 信息 ， 请 参阅 其 官方 文档 ww_fdw。 请 注意 : 每 一 个 FDW 都 有 甚 独特 的 设置 ， 互 不 相同 。 


接 下 来 选 定 至 少 一 个 本 地 角色 来 创建 FDW 用 户 映射 关系 。 每 个 能 连 到 本 地 库 上 的 用 户 
都 应 该 有 权限 访问 Google 搜索 服务 器 ， 因 此 我 们 将 远 端 数据 源 的 访问 权限 映射 给 本 地 的 
public 角色 。 


CREATE USER MAPPING FOR public SERVER www_fdw_server_google search; 


然后 创建 外 部 表 ， 如 示例 10-5 所 示 。 表 中 每 个 字段 对 应 于 Google 自动 生成 的 URL 搜索 路 
径 中 的 一 个 GET 参数 。 


示例 10-5 基于 Google Web 服务 数据 源 创建 一 个 外 部 表 
CREATE FOREIGN TABLE www_fdw_google_search ( 
q text, 
GsearchResultClass text, 
unescapedUrl text, 
url text, 
visibleUrl text, 
cacheUrl text, 
title text, 
content text 
) SERVER www_fdw_server_google_search; 


前 面 设置 用 户 映射 关系 时 未 指定 任何 权限 ， 因 此 需要 进行 一 次 授权 动作 ， 然 后 才 可 以 访问 
外 部 表 。 

GRANT SELECT ON TABLE www_fdw_google_search TO public; 
请 注意 ， 现 在 最 精彩 的 部 分 来 了 : 我 们 以 New ;in PostgresQL 19 作为 关键 词 进行 搜索 ， 并 
用 正则 表达 式 .筛选 掉 返 回 结 果 中 的 HTML 标签 ， 语 句 如 下 所 示 。 


SELECT regexp_replace(title,E'(?x)(< [^>]*? >)','','g') As title 
FROM www_fdw_google_search 
WHERE q= 'New in PostgreSQL 10' 
























































LIMIT 2; 
瞧 吧 ! 我 们 真 的 得 到 了 想 要 的 搜索 结果 。 
title 


PostgreSQL 10 Roadmap 
PostgreSQL: Roadmap 
(2 rows) 
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附录 A 
PostgreS$QL 的 安装 





A.1 Windows 以 及 桌面 Linux 环 境 


EnterpriseDB 公司 为 Windows 和 桌面 Linux 环境 提供 了 安装 包 ， 而且 针对 每 种 OS 都 同时 
提供 了 32 位 和 64 位 的 包 。 
基于 图 形 化 界面 的 安装 包 使 用 起 来 非常 简单 ， 其 中 还 附带 了 pgAdmin 以 及 一 款 辅助 安装 工 
具 StackBuilder。 通 过 StackBuilder， 可 以 为 PostgreSQL 安装 一 些 插件 和 辅助 工具 ， 比 如 
JDBC 驱动 、.NET 驱动 、Ruby 驱动 、PostGIS、phpPgAdmin 管理 工具 和 pgAgent 任务 调 
度 器 等 。 


EnterpriseDB 提供 了 两 个 版 本 的 PostgreSQL 安装 包 : 一 个 是 官方 开源 版 ， 也 叫 社 区 版 ， 另 
一 个 是 商业 版 ， 也 叫 Advanced Plus 版 。 后 者 提供 了 对 Oracle 语法 的 兼容 以 及 一 些 比 社区 
版 更 强大 的 管理 功能 。 这 两 个 版 本 是 有 区 别 的 ， 下 载 时 请 勿 弄 错 。 本 书 中 讨论 的 所 有 内 容 
都 是 针对 官方 开源 版 ， 而 非 闭 源 的 Postgres Plus Advanced Server 版 。 不 过 由 于 二 者 出 自 同 
源 ， 所 以 本 书 绝 大 部 分 内 容 对 于 后 者 也 是 适用 的 。 


BigSQL 是 一 个 开源 的 PostgreSQL 发 行 版 ， 其 开发 工作 主要 由 OpenSCG 公司 赞助 。 
BigSQL 发 行 版 与 EnterpriseDB 公司 的 发 行 版 类 似 ， 二 者 都 提供 Windows、Linux 和 Mac 
下 的 64 位 安装 包 。 

BigSQL 发 行 版 的 历史 没有 EnterpriseDB 发 行 版 那么 悠久 ， 其 目标 是 致力 于 提升 
PostgreSQL 的 互 操作 性 、DevOps 能 力 以 及 大 数据 处 理 能 力 。 因 此 ， 我 们 可 以 在 该 发 行 版 
中 看 到 一 些 其 他 发 行 版 一 般 不 会 原生 提供 的 扩展 包 ， 比 如 pgTSQL， 这 是 一 个 与 Microsoft 
SQL Server 的 TSQL 语法 相同 的 过 程式 语言 扩展 ; 另外 还 含有 一 些 用 于 性 能 测评 和 系统 监 
控 的 扩展 包 ， 比 如 pgBadger。 
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该 发 行 版 还 自 带 





带 了 功能 增强 的 扩展 包 ， 比 如 PostGIS (包括 ogr_fdw) 和 hadoop_fdw、 


cassandra_fdw、oracle_fdw 等 扩展 包 ， 另 外 还 有 很 多 过 程式 语言 扩展 包 。 
同 EnterpriseDB 一 样 ，BigSQL 也 有 它 自己 的 包 管理 器 。 该 包 管理 器 可 以 通过 Web 页 面 调 


月 





日 ， 也 可 以 通过 一 





个 名 为 pgc 的 命令 行 工具 




















调用 ，pgc 的 含义 是 “非常 好 的 命令 行 工 具 ” 


(pretty good command-line) 。pgc 包 管 理工 具 的 用 法 与 Linux 下 的 yum、apt-get 等 包 管 理工 


即使 在 Windows 环境 下 月 











法 也 是 一 样 。 





因此 如 果 要 安装 新 的 包 ， 请 先 打 开 一 个 新 


命令 行 窗口 ， 然 后 把 目录 切换 到 BigSQL 的 安装 目录 。 





更 新 并 查看 本 地 包 列 表 
pgc Update 
pgc _ List 

输出 列表 如 下 : 
Category | Component | Version 
PostgreSQL pg92 9.2.21-1 
PostgreSQL pg93 9.3.17-1 
PostgreSQL pg94 9.4.12-1 
PostgreSQL pg95 9.5.7-1 
PostgreSQL pg96 9.6.3-1 
Extensions cassandra_fdw3-pg96 3.0.1-1 
Extensions hadoop_fdw2-pg96 2.5.0-1 
Extensions oracle fdw1i-pg96 1.5.0-1 
Extensions orafce3-pg96 3.3.1-1 
Extensions pgaudit11-pg96 1.1.0-2 
Extensions pgpartman2-pg96 2.6.4-1 
Extensions pldebugger96-pg96 9.6.0-1 
Extensions plprofiler3-pg96 3.2-1 
Extensions postgis23-pg96 2.3.2-3 
Extensions setuser1-pg96 1.2.0-1 
Extensions tds_fdw1-pg96 1.0.8-1 
Servers pgdevops 1.4-1 
Applications backrest 1.18 
Applications ora2pg 18.1 
Applications pgadmin3 1.23.0a 
Applications pgagent 3.4.1-1 
Applications pgbadger 9.1 
Frameworks java8 8u121 
Frameworks perls 5.20.3.3 
Frameworks python2 2.7.12-1 
Frameworks tcL86 8.6.4-1 

安装 一 个 包 


安装 好 以 后 


pgc instaLL pgdevops 


pgDevops 包 是 一 个 基于 Web 的 管理 工具 ， 其 中 包含 了 pgAdmin4 以 及 用 于 安装 和 监控 
BigSQL 相关 包 的 管理 界面 。 




















T 


， 请 执行 


pgc ;init pgdevops 
pgc start pgdevops 


| ReleaseDt | Status | 人 
2017-05-11 1 
2017-05-11 1 
2017-05-11 1 
2017-05-11 1 
2017-05-11 Installed 1 
2016-11-08 1 
2016-09-01 1 
2016-09-01 1 
2016-09-23 1 
2017-05-18 1 
2017-04-15 1 
2016-12-28 1 
2017-04-15 1 
2017-05-18 Installed 1 
2017-02-23 1 
2016-11-23 1 
2017-05-18 Installed 1 
2017-05-18 1 
2017-03-23 1 
2016-10-20 Installed 1 
2017-02-23 1 
2017-02-09 1 
2017-02-09 1 
2016-03-14 1 
2016-10-20 Installed 0 
2016-03-11 1 
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装 好 以 后 默认 的 访问 路 径 是 : http://localhost:8051。 

如 需 升 级 一 个 现 有 的 包 ， 请 使 用 pgc upgrade 代替 pgc install。 
如 果 希 望 在 同一 台 机 器 上 免 安 装 试用 一 下 不 同 版 本 的 PostgreSQL， 或 者 是 希 
望 从 USB 设备 启动 PostgreSQL，EnterpriseDB 和 BigSQL 均 提 供 了 一 种 免 安 
装 的 解决 方案 。EnterpriseDB 方案 的 具体 内 容 请 参考 “Starting PostgreSQL in 
Windows without Install” 这 篇 文章 。 








A.2 CentOS、 Fedora、Red Hat 以 及 Scientific 


Linux 


大 多 数 Linux/Unix 发 行 版 会 在 其 软件 仓库 中 提供 PostgreSQL， 但 版 本 可 能 比较 老 。 为 了 解 
决 这 个 问题 , 很 多 人 会 使 用 逆向 移植 ' 的 版 本 包 , 这 种 版 本 包 的 软件 仓库 中 会 提供 较 新 版 本 
的 PostgreSQL 软件 。 

对 于 具有 冒险 精神 的 Linux 用 户 来 说 ， 可 以 从 PostgreSQL Yum 仓库 下 载 最 新 版 本 的 
PostgreSQL， 包 括 开 发 中 的 版 本 。 此 仓库 中 不 仅 包含 PostgreSQL 服务 器 核心 组 件 ， 还 包 
含 比 较 常 用 的 扩展 包 。PostgreSQL 的 开发 团队 负责 维护 这 个 仓库 ， 并 且 会 在 第 一 时 间 发 布 
补丁 和 版 本 更 新 。PostgreSQL Yum 仓库 一 般 会 存储 最 近 的 2~4 个 稳定 版 PostgreSQL， 支 
持 的 操作 系统 平台 包括 CentOS、RedHat EL、Fedora、Scientific Linux、Amazon AMI 以 及 


Oracle Enterprise。 


如 果 使 用 的 操作 系统 平台 较 老 或 者 是 仍 需 要 生命 周期 已 经 结束 的 老 版 本 PostgreSQL， 那 
么 是 无 法 使 用 最 新 的 PostgreSQL Yum 仓库 的 ， 请 查阅 文档 了 解 下 哪些 软件 仓库 中 仍然 在 
维护 老 版 本 的 PostgreSQL。 如 果 和 希望 了 解 更 多 基于 Yum 的 软件 安装 机 制 ， 请 参考 我 们 的 
PostgresOnline 网 站 上 关于 Yum 的 内 容 。 


A.3 Debian 和 Ubuntu 


Debian 和 Ubuntu 上 可 以 使 用 apt-postgresql 仓库 来 安装 最 新 的 稳定 版 或 者 开发 版 PostgreSQL。 
apt-postgresql 也 是 个 软件 仓库 ， 其 作用 与 PostgreSQL 开发 组 自己 维护 的 yum postgresql 
软件 仓库 类 似 。Ubuntu 和 Debian 自身 的 默认 软件 仓库 中 一 般 也 会 提供 最 新 的 稳定 版 
PostgreSQL。 典 型 的 安装 命令 如 下 : 


sudo apt-get install postgresql-9.6 



































注 1:“ 逆 向 移植 ”英文 为 backport， 是 指 将 新 版 本 的 软件 一 一 比如 数据 库 软 件 、 工 具 软 件 、 补 丁 包 等 

逆向 移植 到 老 版 本 的 操作 系统 上 ， 这 样 构建 出 来 的 版 本 包 既 能 维持 平台 兼容 性 ， 又 能 提供 新 的 软件 特 
性 ， 从 而 以 最 小 的 代价 解决 了 老 版 本 软件 存在 的 问题 ， 与 全 面 升 级 操作 系统 平台 相 比 ， 这 是 一 种 兼容 
性 好 、 风 险 低 的 解决 方案 。 一 一 译 者 注 
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如 果 你 需要 编译 软件 仓库 中 未 提供 的 扩展 包 ， 需 要 先 安装 postgresql-server-dev 开发 库 ， 命 
令 如 下 : 


sudo apt-get install postgresql-server-dev-9.6 


如 果 你 的 操作 系统 的 默认 软件 仓库 中 未 包含 最 新 版 本 的 PostgreSQL， 那 么 请 访问 Apt 
PostgreSQL packages 站 点 以 获取 最 新 的 稳定 版 或 者 测试 版 PostgreSQL。 该 站 点 同时 还 提供 
一 些 其 他 的 安装 包 ， 比 如 PL/V8 和 PostGIS 等 。 该 站 点 的 软件 包 所 支持 的 操作 系统 一 般 包 
含 Debian 和 Ubuntu 的 最 近 2~3 个 版 本 。 


A.4 FreeBSD 


FreeBSD 是 一 个 常用 的 PostgreSQL 平台 。 你 可 以 从 http://www.freebsd.org/ports/database. 
html 获取 到 最 新 的 适用 于 FreeBSD 平台 的 PostgreSQL， 然 后 通过 FreeBSD 的 包 管 理 系统 


A.5 macOsS 


在 Mac 机 器 上 安装 PostgreSQL 有 很 多 方法 : EnterpriseDB 和 BigSQL 均 提 供 了 独立 安装 
包 ; Homebrew 包 管理 器 使 用 得 越 来 越 广泛 ， 并 且 已 经 吸引 了 一 些 高 级 Mac 用 户 ; Postgres. 
app 是 Heroku 封装 的 一 个 发 行 包 ， 在 新 手 用 户 中 很 流行 ， 另 外 历史 悠久 的 MacPorts 和 Fink 
这 两 个 软件 发 布 平台 也 还 在 继续 提供 服务 。 可 以 看 到 ，Mac 可 用 的 安装 源 很 多 ， 但 我 们 建 
议 Mac 用 户 最 好 从 相同 的 数据 源 下 载 安 装 包 。 比 如 ， 你 使 用 BigSQL 提供 的 安装 包 安 装 了 
PostgreSQL， 那 么 最 好 不 要 用 EnterpriseDB 的 StackBuilder 包 管 理工 具 来 安装 扩展 包 ， 因 为 
可 能 会 出 现 兼 容 性 问题 。 

以 下 列 出 了 每 个 安装 源 的 详细 信息 。 

。 EnterpriseDB 公司 为 macOS 提供 了 一 个 非常 易 用 的 一 键 式 PostgreSQL 安装 包 ， 附 带 了 
pgAdmin 管理 工具 。 此 外 该 公司 还 提供 了 一 个 名 为 StackBuilder 的 软件 ， 通 过 它 可 以 下 
载 常用 扩展 包 、 驱 动 程序 、 编 程 语言 扩展 以 及 管理 工具 等 。 

。 BigSQL 也 提供 了 一 个 非常 易 用 的 一 键 式 安装 包 ， 支 持 64 位 macOS。 如 需 安装 扩展 包 ， 
BigSQL 提供 了 一 个 名 为 pgc 的 命令 行 工 具 以 及 一 个 名 为 pgDevops 的 Web 管理 工具 ， 
其 详情 A.1 证 已 经 讨论 过 。 通 过 它 可 以 下 载 常 用 扩展 包 、 驱 动 程序 、 编 程 语言 扩展 以 及 
管理 工具 等 。BigSQL 当前 在 非 Windows 环境 中 支持 PL/V8 扩展 包 。 

。 Homebrew 是 macOS 下 的 一 个 安装 包 管 理 器 ， 支 持 包括 PostgreSQL 在 内 的 很 多 软件 的 安 
装 管理 。“PostgreSQL, Homebrew, and You” 这 篇 博客 文章 介绍 了 如 何 使 用 Homebrew 来 
安装 PostgreSQL。 你 还 能 在 Homebrew PostgreSQL Wiki 站 点 看 到 大 量 有 价值 的 相关 文章 。 

。 由 Heroku 开发 团队 提供 的 PostgreSQL.app 是 一 个 免费 的 桌面 应 用 安装 包 ， 号 称 是 

Mac 平台 上 最 方便 易 用 的 PostgreSQL 安装 包 。 该 安装 包 一 般 都 是 基于 最 新 版 本 的 

PostgreSQL 构建 ， 其 中 还 附带 了 常用 的 扩展 包 ， 比 如 PostGIS、PL/Python 和 PL/V8 等 。 

Postgres.app 作为 一 个 独立 的 应 用 程序 运行 ， 可 以 按 需 启动 和 停止 ， 非 常 适合 用 于 开发 ， 

也 适用 于 单 用 户 场 景 。 
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。 MacPorts 是 macOS 平台 上 的 一 个 软件 发 布 平台 ， 支 持 大 量 的 开源 软件 ， 可 以 实现 软件 
包 的 编译 、 安 装 、 升 级 等 操作 。 它 是 Mac 操作 系统 上 最 早 支 持 PostgreSQL 的 软件 发 布 
平台 。 

。 Fink 是 macOS 上 的 另 一 个 软件 发 布 平台 ， 底 层 基 于 Debian 的 apt-get 软件 安装 框架 。 
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附录 B 
PostgreSQL 自 带 的 命令 行 工具 





以 下 内 容 集中 介绍 了 PostgreSQL 的 必 备 命令 行 工具 ， 本 书 的 正文 部 分 已 经 对 它们 的 功能 进 
行 了 翔实 的 介绍 ， 此 处 仅 列 出 它们 的 帮助 信息 。 我 们 希望 通过 提供 这 部 分 内 容 为 你 节省 一 
些 时 间 ， 也 希望 能 让 这 本 书 成 为 你 更 好 的 工作 助手 。 


B.1 使 用 pg_dump 进 行 数 据 库 备份 


pg_dump 可 备份 一 个 database 的 全 部 或 者 部 分 数据 。 支 持 的 备份 格式 有 : TAR 包 格 式 、 
PostgreSQL 自 定义 压缩 格式 、 纯 文本 格式 以 及 SQL 文本 格式 。 纯 文本 格式 转 储 的 内 容 
中 含有 psql 专 有 命令 行 ， 因 此 恢复 时 也 需要 通过 psql 工具 来 执行 此 文本 。SQL 文本 格 
式 转 储 的 是 仅 包含 标准 CREATE 和 INSERT 命令 的 SQL 脚本 ,恢复 时 你 可 以 使 用 psql 或 者 
pgAdmin 工具 来 运行 该 脚本 。 示 例 B-1 显示 的 是 pg_dump 命令 的 帮助 信息 。 如 果 要 了 解 
pg_dump 的 全 部 用 法 ， 请 参见 2.7.1 市 。 


示例 B-1 pg_dump 帮助 信息 
pg_dump - -helLp 



























































pg_dump 可 将 某 个 database 转 储 为 文本 文件 或 者 其 他 格式 文件 。 
用 法 : 
pg_dump [选项 ]... [database 名 ] 




















| 
- -file=FILENAME 输出 文件 名 或 者 目录 名 
中 --format=c|d|tl|p 输出 文件 格式 〈 自 定义 格式 、 目 录 格 式 、TAR 包 格式 、 纯 文 
-j，- -jobs=NUM 使 用 这 多 个 并 行 作业 进行 转 储 
-V，--verbose 详细 信息 模式 
-Z，--cCompress=0-9 压缩 格式 的 压缩 级 别 
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--lock-wait-timeout=TIMEOUT 
--No-sync 

--help 

--version 
控制 输 昌 [| 内 容 的 选项 ¥ 

-a, --data-only 

-b, --blobs 

-B, --no-blobs 

-C，--CLean 

-C, --cCreate 

-E, --encoding=ENCODING 
-nNn, --schema=SCHEMA 

-N, --exclude-schema=SCHEMA 
-0，--otds 

-0，--no-owner 
-S，--Schema-onLy 
-9，--SUperuser=NAME 

-七 ，- -tabLe=TABLE 
-T，--excLude-tabLe=TABLE 
-X，--no-priviLeges 
--binary-upgrade 
--Column-inserts 
--disable-dollar-quoting 
--disable-triggers 
--enable-row-security 
--exclude-table-data=TABLE 
--if-exists 
--inserts 
--no-publications 
--no-security-labels 
--no-subscriptions 
--no-synchronized-snapshots 
--no-tablespaces 
--no-unlogged-table-data 
--quote-all-identifiers 
--Section=SECTION 





DO O 


〇 


--serializable-deferrable 
--snapshot=SNAPSHOT 
--strict-names 


--Use-set-session-authorization 


连接 选项 : 
-d，--dbname=DBNAME 
-h，- -host= 主 机 名 
-PpP，--port= 端 口号 
-U，--username= 名 称 
-W，--no-password 
-W, --password 
--role=ROLENAME 





等 待 表 锁 超 时 后 操作 失败 

不 等 待 变更 安全 写 入 磁盘 @ 
显示 此 帮助 信息 并 退出 

输出 版 本 信息 并 退出 


仅 转 储 数据 ， 而 不 转 储 schema 

在 转 储 中 包含 大 对 象 

不 对 大 对 象 进行 备份 @ 

在 重新 创建 数据 库 对 象 之 前 清除 (删除) 数据 库 对 象 
包含 用 于 在 转 储 中 创建 数据 库 的 命令 

以 ENCODING 编 码 格式 转 储 数据 

仅 转 储 命名 schema 

不 转 储 命 名 schema 

在 转 储 中 包含 0ID 

以 纯 文 本 格式 跳 过 对 象 所 有 权 的 恢复 

仅 转 储 schema， 而 不 转 储 数据 

要 以 纯 文 本 格式 使 用 的 超级 用 户 名 

仅 转 储 命名 表 

不 转 储 命名 表 

不 转 储 特权 (grant/revoke) 

仅 供 升级 工具 使 用 
以 带 有 列 名 的 INSERT 命 令 令 的 形式 转 储 数据 

禁用 美元 (符号) 引号 ， 而 是 使 用 SQL 标准 引号 
在 仅 恢复 数据 期 间 禁 用 触发 器 
启用 行 级 安全 控制 〈 只 导出 用 户 有 权 访 问 的 数据 ) @ 
不 转 储 命名 表 中 的 数据 
| 除 对 象 时 使 用 IF EXISTS 

以 INSERT 命 令 (而 非 COPY 命 令 ) 的 形式 转 储 数据 
不 导出 逻辑 复制 发 布 端 数 据 源 定义 @ 

不 转 储 安全 标签 分 配 
不 导出 逻辑 复制 订阅 端的 数据 订阅 定义 @ 

在 并 行 作业 中 不 使 用 同步 快照 

不 转 储 表 空 间 分 配 

不 转 储 不 记录 WAL 日 志 的 表 的 数据 

所 有 标识 符 加 引号 ， 即 使 不 是 关键 字 也 加 

转 储 命名 部 分 (包括 三 个 部 分 : pre-data、data 以 及 post- 
data。data 部 分 包含 表 记 录 数 据 、 大 对 象 数 据 以 及 序列 的 
值 ， post-data 部 分 包含 索引 、 触发 器 、 规 则 和 约束 (除了 
验证 检查 约束 ) 的 定义 ;， pre-data 部 分 包含 此 外 其 他 所 有 
的 对 象 定义 ) 

等 待 直至 转 储 正常 运行 为 止 

为 导出 使 用 指定 的 快照 @ 

要 求 每 个 表 和 /或 schema 包 括 模式 以 匹配 至 少 一 个 实体 @ 
使 用 SESSION AUTHORIZATION 命令 代替 ALTER OWNER 
命令 来 设置 所 有 权 


要 转 储 的 数据 
数据 库 服务 器 主机 或 套 接 字 目录 
数据 库 服务 器 端口 号 

作为 指定 数据 库 用 户 连接 
永远 不 提示 输入 密码 

强制 要 求 输入 密码 〈 应 该 自动 发 生 ) 
在 转 储 之 前 执行 SET ROLE 命令 
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OQ@8@ PostgreSQL 10 中 引入 的 新 特性 。 
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| 附录 B 


@ PostgreSQL 9.6 中 引入 的 新 特性 。 
@@ PostgreSQL 9.5 中 引入 的 新 特性 。 
@ PostgreSQL 9.4 中 引入 的 新 特性 。 


B.2 服务 器 级 备份 工具 pg_dumpall 


使 用 pg_dumpall 工具 可 以 将 服务 器 上 的 所 有 数据 库 备份 到 单个 纯 文本 文件 或 者 单个 纯 文 本 
间 等 系统 级 对 象 的 信息 ， 这 类 信息 不 属于 
任何 一 个 数据 库 。 示 例 B-2 列 出 了 pg_dumpall 的 所 有 帮助 信息 。pg_dumpall 的 具体 用 法 请 


SQL 文件 上 。 该 备份 工具 将 自动 备份 角色 和 表 空 




















































































































参考 2.7.2 节 。 
示例 B-2 ”pg_dumpall 帮助 信息 
pg_dumpaLL - -heLp 
pg_dumpaLL 可 以 将 一 个 PostgreSQL 数 据 库 集 群 中 的 所 有 数据 都 提取 到 一 个 SQL 脚本 文件 中 。 用 
法 : 
pg_dumpall [选项 ].. . 
通用 选项 : 
-f, --file=FILENAME 输出 文件 名 
-V，--verbose 详细 模式 
-V，--verstion 输出 版 本 信息 ， 然 后 退出 
--Lock-watit-timeout=TIMEOUT 等 待 表 锁 超 时 后 操作 失败 
-?, --help 显示 此 帮助 信息 并 退出 
控制 输出 内 容 的 选项 : 
-a, --data-only 仅 转 储 数据 ， 而 不 转 储 schema 
-c, --Clean 重新 创建 数据 库 之 前 清除 (删除 ) 数据 库 
-g, --globals-only 仅 转 储 全 局 对 象 ， 而 不 转 储 数据 库 
-0，--otds 在 转 储 中 包含 0ID 
-0，--no-owner 以 纯 文 本 格式 跳 过 对 象 所 有 权 的 恢复 
-r, --roles-only 仅 转 储 角 色 ， 而 不 转 储 数据 库 和 表 空 间 
-s, --schema-only 仅 转 钳 schena， 而 不 转 储 数据 
-S, --superuser=NAME 要 在 转 储 中 使 用 的 超级 用 户 名 
-t, --tablespaces-only 仅 转 储 表 空间 ， 而 不 转 储 数据 库 和 角色 
-x,--no-privileges 不 转 储 特权 (grant/revoke) 
--binary-upgrade 仅 供 升级 工具 使 用 










































































--column-inserts 以 带 有 列 名 的 INSERT 命 令 的 形式 转 储 数据 
--disable-dollar-quoting 禁用 美元 (符号 ) 引号 ， 而 是 使 用 SQL 标准 引号 
--disable-triggers 在 仅 恢复 数据 期 间 禁 用 触发 器 

--inserts 以 INSERT 命 令 (而 非 COPY 命 令 ) 的 形式 转 储 数据 
--no-publications 不 导出 逻辑 复制 发 布 端 数据 源 定义 @ 
--no-security-labels 不 转 储 安全 标签 的 分 配 

--no-subscriptions 不 导出 逻辑 复制 订阅 端的 数据 订阅 定义 @ 
--no-sync 不 等 待 变更 安全 写 入 磁盘 四 
--no-security-labels 不 转 储 安全 标签 分 配 

--no-tablespaces 不 转 储 表 空 间 分 配 

--no-unlogged-table-data 不 转 储 不 记录 WAL 日 志 的 表 的 数据 
--no-roLe-passwords 不 转 储 角 色 的 密码 @ 





--quote-all-identifiers 
--Use-set-session-authorization 


命令 来 设置 所 有 权 


所 有 标识 符 加 引号 ， 即 使 不 是 关键 字 也 加 
使 用 SET SESSION AUTHORIZATION 命 令 代替 ALTER OWNER 





PostgreSQL 自 带 的 命令 行 








-d4，--dbname=CONNSTR 
-h，--host= 主 机 名 
-L，--database=DBNAME 


-p，--port= 端 口号 

--Username= 名 称 

-WwW，--no-password 
，--password 

en ROLENAME 


1 
全 
- 


1 
三 





使 用 连接 连接 串 连 接 

数据 库 服务 器 主机 或 套 接 字 目录 
替代 默认 数据 库 
数据 库 服务 器 端口 号 

作为 指定 数据 库 用 户 连 接 
永远 不 提示 输入 密码 
强制 要 求 输入 密码 (应 该 自动 发 生 ) 
在 转 储 之 前 执行 SET ROLE 命 令 















































如 果 未 使 用 -f/--file， 则 会 将 SQL 脚 本 写 到 标准 输出 中 。 


OQ88@@ PostgreSQL 10 中 引入 的 新 特性 。 


B.3 database 数 据 恢 


可 以 使 用 pg_restore 可 恢复 使 用 pg_dump 
包 格 式 、 自 定义 压缩 格式 以 及 目 








有 关 使 用 pg_restore 的 实例 ， 请 参见 2.7. 


示例 B-3 pg_restore 帮助 信息 
pg_restore --help 


pg_restore 可 以 从 pg_dump 创 建 的 存档 中 
pg_restore [选项 ]... [文件 名 ] 























复工 具 pg_restore 


创建 的 备份 文件 ， 这 些 备份 文件 的 格式 包括 TAR 
等 。 示例 B-3 是 pg_restore 命令 的 帮助 信息 。 更 多 
3 市 。 














恢复 一 个 PostgreSQL 数 据 库 。 用 法 : 



























































































































































通用 选项 ， 

-d，--dbname=NAME 连接 到 数据 库 名 称 

-f，--file= 文 件 名 输出 文件 名 

-F, --format=c|d|t 备份 文件 格式 (应 该 是 自动 的 ) 

-1l, --list 打印 存档 的 汇总 目录 

-v, --verbose 详细 信息 模式 

-V，--version 输出 版 本 信息 并 退出 

-?, --help 显示 此 帮助 信息 并 退出 

恢复 控制 选项 : 

-a, --data-only 仅 恢 复数 据 ， 而 不 恢复 schema 

-C，--cCLean 在 重新 创建 数据 库 对 象 之 前 清除 (删除 ) 数据 库 对 象 
-C，--create 创建 目标 数据 库 

-e, --exit-on-error 恢复 期 间 发 生 错误 时 退出 ， 若 不 设 定 则 默认 为 继续 恢复 
-I，- -index=NAME 恢复 命名 索 引 

-j，- -jobs=NUN 使 用 这 多 个 并 行 作业 进行 恢复 

-L, --use-list=FILENAME 将 此 文件 的 目录 用 于 选择 输出 或 对 输出 进行 排序 
-n, --schema=NAME 仅 恢复 此 schema 中 的 对 象 

-N，- -excLude-schema=NAME 不 恢复 该 schema 中 的 对 象 @ 

-0，--no-owner 跳 过 对 象 所 有 权 的 恢复 

-P, --function=NAME(args) 恢复 命名 函数 

-s, --schema-only 仅 恢复 schema， 而 不 恢复 数据 
-S，--superuser=NAME 用 于 禁用 触发 器 的 超级 用 户 名 

-t，- -tabLe=NAME 恢复 命名 表 〈 含 表 和 视图 等 ) @ 

-T, --trigger=NAME 恢复 命名 触发 器 

-X，--no-priviLeges 跳 过 访问 特权 (grant/revoke) 的 恢复 
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-1, 四 


-single-transaction 


--enable-row-security 
--disable-triggers 


os 
sO 
ho 
SO 
Sn 


data-for-failed-tables 
publications 
security-labels 
subscriptions 
tablespaces 


--section=SECTION 


--strict-names 








作为 单个 事务 恢复 

启用 行 安全 性 @ 

在 仅 恢复 数据 期 间 禁 用 触发 器 

如 果 表 创建 失败 ， 则 不 对 其 进行 数据 恢复 

不 导出 逻辑 复制 发 布 端 数 据 源 定义 @ 

不 恢复 安全 标签 

不 导出 逻辑 复制 订阅 端的 数据 订阅 定义 @ 

不 恢复 表 空 间 分 配 

恢复 命名 部 分 (包括 三 个 部 分 : pre-data、data 以 及 post- 
data。data 部 分 包含 表 记 录 数 据 、 大 对 象 数 据 以 及 序列 的 
值 ，post-data 部 分 包含 索引 、 触 发 器 、 规 则 和 约束 (除了 
验证 检查 约束 ) 的 定义 ;pre-data 部 分 包含 此 外 其 他 所 有 
的 对 象 定 义 ) 

















要 求 每 个 表 和 /或 schema 包 括 模式 以 匹配 至 少 一 个 实体 @ 



































--Use-set-session-authorization 使 用 SET SESSION AUTHORIZATION 命 令 代 赫 ALTER 
OWNER 命 令 来 设置 所 有 权 

连接 选项 : 

-h，--host= 主 机 名 数据 库 服 务 器 主机 或 套 接 字 目录 

-p，--port= 端 口号 数据 库 服务 器 端口 号 

-U，- -username= 名 称 作为 指定 数据 库 用 户 连 接 

-W，--no-password 永远 不 提示 输入 密码 

-W, --password 强制 要 求 输入 密码 (应 该 自动 发 生 ) 


--role=ROLENAME 











在 恢复 之 前 执行 SET ROLE 命 令 


DB PostgreSQL 10 中 引入 的 新 特性 
@@ PostgreSQL 9.6 中 引入 的 新 特性 。 在 9.6 版 之 前 ，-t 选项 只 用 于 过 滤 普 通 表 。 在 9.6 版 


中 ， 它 拓展 支持 了 外 表 、 视 








图 、 物 化 视图 和 序列 号 生成 器 。 





@ PostgreSQL 9.5 中 引入 的 新 特性 


交互 模式 下 的 psql 命 令 


B.4 


示例 B-4 中 列 昌 


用 方法 。 





H 了 psql 在 交互 模式 下 支持 的 命令 。 请 参考 3.1 市 和 3.2 市 的 例子 了 解 其 使 


示例 B-4 psql 交互 模式 下 支持 的 命令 


\? 


通用 命令 
\copyright 
\errverbose 
\g [文件 ] or ; 
\gexec 

\gset [PREFIX] 
\h [名 称 ] 

\gx [文件 ] 


\q 


\crosstabview [COLUMNS] 
\watch [SEC] 


显示 PostgreSQL 使 用 和 分 发 条 束 

以 最 元 长 的 形式 显示 最 近 的 错误 消息 @ 

执行 查询 (并 将 结果 发 送 给 文件 或 | 管道 ) 

执行 策略 ， 然 后 执行 其 结果 中 的 每 个 值 @ 

执行 查询 并 将 结果 存储 到 psql 变 量 

关于 SQL 命 令 语法 的 帮助 ，* 代 表 所 有 命令 
作用 与 \g 相 同 ,但 强行 要 求 使 用 展开 模式 显示 结果 @ 
退出 psql 
执行 查询 并 且 以 交叉 表 显 示 结 果 @ 
每 隔 SEC 秒 执行 一 次 查询 
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帮助 
\? [commands] 
\? options 
\? variables 


\h [名 称 ] 


查询 缓冲 区 相关 命令 

\e [FILE] [LINE] 

\ef [FUNCNAME [LINE]] 
\ev [VIEWNAME [LINE]] 








输入 /输出 相关 命令 
\copy ... 

\echo [字符 串 ] 
注 文 你 

\ir FILE 


\o [文件 ] 
\qecho [字符 串 





[ 


条 件 命令 @ 
\if EXPR 
\elif EXPR 
\else 
\endif 


信息 查询 命令 
(选项 ， 9 = 
\d[S+] 

\d[S+] 名 称 
\da[S] [模式 ] 
\dA[+] [模式 ] 
\db[+] [模式 ] 
\dc[S] [模式 ] 
\dc [模式 ] 
\dd[S] [模式 ] 
\ddp [模式 ] 
\dp[S] [模式 ] 
\det[+] [模式 ] 
\des[+] [模式 ] 
\deu[+] [模式 ] 
\dew[+] [模式 ] 
\df[antw][S+] [模式 ] 


\dF[+] [模式 ] 
\dFd[+] [模式 ] 
\dFp[+] [模式 ] 
\dFt[+] [模式 ] 
\dg[S+] [模式 ] 
\di[S+] [模式 ] 
\dl 


显示 系统 对 象 ，+ 




















显示 反 斜 线 命令 的 帮助 
显示 psql 命令 行 选 项 的 帮助 
显示 特殊 变量 的 帮助 
SQL 命令 语法 上 的 说 明 ， 用 * 显 示 全 部 命令 的 语法 说 明 


使 用 外 部 编辑 器 编辑 查询 缓冲 区 
使 用 外 部 编辑 器 编辑 函数 定义 
用 外 部 编辑 器 编辑 视图 定义 @ 
Te 区 的 内 容 

重 置 (清除 ) 查询 缓冲 区 

将 查询 缓冲 区 写 入 到 文件 


(或 文件 ) 


























执行 SQL COPY， 将 数据 流 发 送 到 客户 端 主 机 
将 字符 串 写 到 标准 输出 
从 文件 执行 命令 


























凤 本 所 在 的 目录 
将 所 有 查询 结果 发 送 到 文件 或 | 管道 

















输出 将 写 入 由 \o 设 置 的 输出 通道 


开局 一 个 条 件 判定 块 

当前 条 件 判定 块 中 的 分 支 条 件 判定 
当前 条 件 判定 块 中 的 最 终 条件 判 定 
条 件 块 结束 符 


























附加 的 详细 信息 ) 

出 表 、 视 图 和 序列 列表 
述 表 、 视 图 、 序 列 或 索引 
出 聚合 函数 列表 

上 访问 方法 @ 

H 表 空间 列表 

出 编码 转换 (conversion) 

出 类 型 强制 转换 (cast) 列 寻 

示 对 象 上 的 注释 
默认 权限 列表 
昌 域 列表 

出 外 部 表 列 表 

出 外 部 服务 器 列表 
出 用 户 映 射 列表 

出 外 部 数据 封装 器 列表 





过 





党 


-4 


表 


A 
二 
AI 一 








| 


到 压 





SS 

















2 3 


~ 
三 


-窗口 函数 ) 列表 


已 


文本 搜索 解析 器 列表 
文本 搜索 模版 列表 

角色 列表 

bb 索引 列表 

大 对 象 列表 ， 与 \tlo_list 相 同 


y 
[ss 
过 
六 区 
并 
站 
二 
子 
半 
小 




















E 压 
[4 
六 
六 
证 
站 





二 起 过 起 





SS 

















寿 于 正己 压 四 


SS 


与 \i 类 似 ， 但 是 在 脚本 中 执行 时 ， 认 为 目标 文件 的 位 置 是 当前 





将 字符 串 写 入 到 查询 输出 流 ， 该 命令 等 效 于 \echo， 


下 


区 别 是 所 有 


出 特定 类 型 函数 ( 仅 a- 聚 合 函 数 /n- 常 规 函数 /t- 触 发 器 函数 
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\dL[S+] [模式 ] 输出 过 程式 语言 列表 

\dm[S+] [模式 ] 输出 物化 视图 列表 

\dn[S+] [模式 ] 输出 schema 列 表 

\do[S] [模式 ] 输出 运算 符 列表 

\do[S+] [模式 ] 输出 排序 规则 列表 

\dp [模式 ] 输出 表 、 视 图 和 序列 访问 权限 列表 
\drds [模式 1 [模式 2]] 输出 每 个 database 的 角色 设置 列表 
\dRp[+] [PATTERN] 列 出 逻辑 复制 的 数据 源 定义 @ 
\dRs[+] [PATTERN] 列 出 逻辑 复制 的 订阅 定义 9 

\ds[S+] [模式 ] 输出 序列 列表 

\dt[S+] [模式 ] 输出 表 列 表 

\dT[S+] [模式 ] 输出 数据 类 型 列表 

\du[S+] [模式 ] 输出 角色 列表 

\dv[S+] [模式 ] 输出 视图 列表 

\dE[S+] [模式 ] 输出 外 部 表 列 表 

\dx[+] [模式 ] 输出 扩展 列表 

\dy [模式 ] 输出 事件 触发 器 列表 

\L[+] 输出 数据 库 列 表 

\sf[+] FUNCNAME 显示 函数 定义 

\sv[+] VIEWNAME 显示 一 个 视图 的 定义 @ 

\z [模式 ] 和 \dp 的 功能 相同 

格式 化 相关 命令 

\a 在 非 对 齐 输 出 模式 和 对 齐 输出 模式 之 间 切 换 
\C [字符 串 ] 设置 表 标题 ， 或 者 如 果 疫 有 ， 则 不 设置 
\f [字符 串 ] 显示 或 设置 非 对 齐 查询 输出 的 字段 分 隔 符 
\H 切换 HTML 输 出 模式 (当前 关闭 ) 

\pset NAME [VALUE] 设置 表 输出 选项 








(NAME 的 可 选项 有 format、border、expanded、fieldsep、 
fieldsep_zero、 footer、 null、numericlocale.、 
recordsep、tuples_only、title、tableattr、pager、 
pager_min_lines、recordsep、recordsep_zero、tableattr、 
title、 tuples_only、 unicode border_linestyle. 

unicode column_linestyle、 unicode header linestyle) @ 









































\t [on|off] 仅 显 示 行 (当前 关闭 ) 

\T [字符 串 ] 设置 HTML 

\x [onloff] 切换 扩展 输出 (当前 关闭 ) 

连接 相关 命令 

N\c[onnect] {[DBNAME|- USER|- HOST|- PORT|-] | conninfo} 
连接 到 新 数据 库 (当前 是 "postgres") 

\encoding [编码 名 称 ] 显示 或 设置 客户 端 编码 

\password [USERNAME] 安全 地 为 用 户 更 改 密码 

\conninfo 显示 当前 连接 的 相关 信息 

操作 系统 相关 命令 

\cd [目录 ] 更 改 当前 工作 目录 

\setenv NAME [VALUE] 设置 或 取消 设置 环境 变量 


\timing [on|off] 
! [命令 ] 


OQ@8@ PostgreSQL 10 中 引入 的 新 特性 。 所 有 的 条 件 参 数 都 是 














切换 命令 计时 开关 (当前 关闭 ) 
在 shett 中 执行 命令 或 启动 交互 式 shett 


新 引入 的 。 

















9868668669@ PostgreSQL 9.6 中 引入 的 新 特性 。 
@@ PostgreSQL 9.5 中 引入 的 新 特性 。 
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B.5 非 交互 模式 下 的 psql 命 令 


示例 B-5 是 非 交 互 模式 下 psql 的 命令 和 


3.2 节 。 




















日 户 名 ] ] 





示例 B-5 psql 基本 帮助 信息 
psql --help 
psql 是 PostgreSQL 的 交互 式 终端 。 
使 用 方法 : 
psql [选项 ]... [database 名 称 [月 
通用 选项 : 
-C,--Command= 命 邻 
-d，--dbname= 数 据 库 名 称 
-f，--file= 文 件 名 
-L，--List 
-V, --Set=, --variable=NAME=VALUE 
-X, --no-psqlrc 
-1 ("one"), --single-transaction 


-?, --help[=options] 
--help=commands 
--help=variables 


--version 

输入 和 输出 选项 : 

-a, --echo-all 

-b, --echo-errors 

-e, --echo-queries 
-E, --echo-hidden 
-L，--Log-fitLe= 文 件 名 
-n，--no-readLine 
-0，--oOuUtput=FILENAME 
-q, --quiet 

-s, --single-step 

-S, --single-line 
输出 格式 选项 : 
-A，--no-aLign 





，--fieLd-separator= 字 符 
，--htmL 
，--pset=VAR[=ARG] 





，--tuples-only 
，--table-attr= 文 本 


-X，--expanded 
-z, --field-separator-zero 
-0，--record-separator-zero 


仅 运行 单个 命令 〈SQL 或 内 部 命令 ) ， 





要 连接 到 的 数据 库 名 称 
从 文件 执行 命令 ， 然 后 退出 
列 出 可 用 的 数据 库 ， 然 后 退出 














设置 psql 变 量 NAME 为 VALUE 
(例如 ，-v ON_ERROR_STOP=1) 
不 读 取 启动 文件 (~/ .psqlrc) 
将 命令 文件 作为 单一 事务 执行 
显示 此 帮助 ， 然 后 退出 
列 出 反 斜 线 命令 ， 然 后 退出 
特殊 变量 ， 然后 退出 @ 
版 本 信息 并 退出 











0 





LH 
口 
LH 
a 





可 显 所 有 来 自 于 脚本 的 输入 
可 显 失 败 的 命令 @ 

可 显 发 送 给 服务 器 的 命令 
显示 内 部 命令 生成 的 查询 
将 会 话 日 志 发 送 给 文件 
禁用 增强 命令 行 编辑 功能 
将 查询 结果 发 送 给 文件 (或 | 管 
以 静默 模式 运行 (不 显示 消息 ， 
单 步 模式 (每 个 查询 均 需 确认 ) 
单行 模式 (SQL 命令 不 允许 跨行 ) 






































(read 























非 对 齐 表 输 出 模式 


串 设 置 字段 分 隔 符 〈 默 认为 “|”) 


HTML 表 输出 模式 
将 打印 选项 VAR 设 置 为 AR (参见 \ 





--record-separator= 字 符 串 设置 记录 分 隔 符 (默认 为 换行 符 ) 


仅 打 印行 
设置 HTML 表 标记 属性 (例如: 
打开 扩展 表 输 出 

将 字段 分 隔 符 设置 为 零 字 节 
将 记录 分 隔 符 设置 为 零 字 节 


基 




















行 帮助 信息 。 关 于 该 模式 下 的 具体 使 用 例子 请 参考 





然后 退出 


Line) 


道 ) 


仅 显 示 查 询 输出 ) 





pset 命 令 ) 


度 、 


边框 等 ) 
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连接 选项 : 





















































-h，--host= 主 机 名 数据 库 服务 器 主机 或 套 接 字 目录 
-p，--port= 端 口 数据 库 服务 器 端口 (默认 为 “5432”) 
-U，--username= 用 户 名 数据 库 用 户 名 

-Ww,--no-password 永远 不 提示 输入 密码 

-WH, --password 强制 要 求 输入 密码 (应 该 自动 发 生 ) 














如 需 了 解 更 多 信息 ， 请 在 psqL 中 输入 “\?” (用 于 内 部 命令 ) 或 者 “\help” (用 于 SQL 命 
令 ) ， 或 者 参考 PostgreSQL 官 方 手 册 中 的 psqt 部 分 。 


DBB PostgreSQL 9.5 中 引入 的 新 特性 。 
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作者 简介 

Regina Obe (瑞金 娜 , 奥 贝 ) 是 位 于 美国 波士顿 的 数据 库 咨 询 服务 公司 Paragon Corporation 
的 负责 人 之 一 。 她 具有 20 余年 的 数据 库 领 域 从 业经 验 ， 精 通 多 种 编程 语言 和 数据 库 系 统 ， 
特别 是 在 空间 数据 库 方 面 尤为 专长 。 她 是 PostGIS 指导 委员 会 成 员 ， 同 时 也 是 PostGIS、 
pgRouting 和 GEOS 核心 开发 团队 的 成 员 。 Regina 拥有 麻 省 理工 学 院 机械 工 程 学 士 学 位 ， 
是 PostGIS in Action 和 pgRouting: 4 Practical Guide 这 两 本 书 的 作者 之 一 。 


Leo Hsu ( 利 奥 . 徐 ) 也 是 Paragon Corporation 公司 的 负责 人 之 一 。 他 有 着 20 余年 的 数据 库 
领域 从 业经 验 ， 曾 为 许多 不 同 规模 的 公司 和 组 织 做 过 数据 库 开 发 工作 ， 对 数据 库 领 域 有 着 非 
常 深入 的 思考 和 研究 。Leo 拥有 斯 坦 福 大 学 经 济 系统 工程 硕士 学 位 以 及 麻 省 理工 学 院 机 械 工 
程 与 经 济 学 硕士 学 位 ， 他 也 是 PoslG1S in Action 和 pgRouting: 4 Practical Guide 这 两 本 书 的 
作者 之 一 。 


封面 介绍 

本 书 封 面 上 的 动物 是 象 移 (拉丁 名 为 Macroscelides proboscideus) ， 这 是 一 种 原 产 于 非洲 的 
食 虫 性 哺乳 动物 ， 广 泛 分 布 于 非洲 南部 ， 因 有 着 类 似 大 象 的 长 鼻 而 得 名 。 它 们 能 够 适应 各 
种 各 样 的 生存 环境 : 无 论 是 纳米 布 沙漠 ， 还 是 砾石 覆盖 的 南部 非洲 地 区 ， 甚 至 茂密 的 森林 
地 带 ， 都 是 它们 的 栖 居 之 地 。 


象 效 是 一 种 体型 很 小 的 四 足 动物 。 由 于 尾巴 非常 相似 ， 象 鹏 外 表 上 看 起 来 像 是 老鼠 或 者 负 
息 。 相 较 于 其 体型 来 说 ， 它 们 的 腿 可 以 说 相当 之 长 ， 因 此 它们 可 以 跳跃 行走 ， 看 起 来 和 和 免 
子 很 相似 。 它 们 的 鼻子 根据 亚 种 的 不 同 而 长 度 各 异 ， 但 在 寻找 食物 时 都 可 以 左右 捏 动 。 
虽然 象 移 是 一 种 活跃 的 尽 行 性 动物 ， 但 由 于 其 个 性 机 警 ， 所 以 一 般 很 难 见 到 或 者 捕捉 到 它 
们 。 它 们 很 善于 伪装 ， 在 遇 到 危险 时 会 迅速 逃避 ， 

象 移 并 非 高 度 群居 性 的 动物 ， 很 多 个 体 都 是 以 一 夫 一 和 妻 的 方式 结伴 生活 并 共同 保护 它们 的 
领地 。 瞿 性 象 移 有 着 类 似 人 类 女性 的 月 经 周期 ， 其 发 情 期 会 持续 好 几 天 。 次 性 个 体 怀 孕 以 
后 ， 其 妊娠 期 会 持续 45 至 60 天 ,一 年 会 生育 若干 胎 ， 每 胎 约 有 1 到 3 只 幼 移 。 幼 移出 生 
时 其 身体 已 经 发 育 得 比较 完全 ， 几 天 后 就 会 离开 巢穴 。 

出 生 5 天 之 后 ,， 幼 移 开 始 进食 昆虫 ， 这些 昆虫 由 它们 的 母 亲 捕 获 并 衔 在 口中 携带 回来 。 幼 
移 会 在 出 生 之 后 大 约 15 天 开始 尝试 独立 生活 并 逐步 减少 对 母亲 的 依赖 。 随 后 它们 会 圈定 
自己 的 领地 ， 并 在 41 至 46 天 内 达到 性 成 熟 状 态 。 

成 年 象 效 主要 以 无 养 椎 动物 为 食 ， 比 如 昆虫 、 蜂 蛛 、 昌 蛤 、 千 足 贝 以 及 星 电 等 。 要 想 吃 掉 
个 头 更 大 些 的 猎物 对 它们 来 说 会 有 点 困难 ， 它 们 必须 用 肢 拖 住 猎物 ， 再 用 牙齿 把 食物 撕 扯 
成 碎片 ， 等 这 些 砍 片 落 到 地 上 之 后 ， 象 移 会 像 食 蚁 兽 那 样 用 千 头 将 它们 生 进 嘴 里 。 象 秽 同 
时 也 是 植 食性 动物 ， 如 果 能 找到 的 话 ， 嫩 叶 、 种 子 、 小 型 果实 等 也 都 是 它们 的 美食 。 

很 多 出 现在 O'Reilly 图 书 封面 上 的 动物 都 濒临 灭绝 ， 它 们 的 存在 对 于 维持 地 球 的 物种 多 样 
性 非常 重要 ， 如 果 你 希望 为 保护 它们 尽 一 份 力量 ， 请 访问 animals.oreilly.com 以 了 解 详情 。 


封面 图 片 来 自 于 Meyers Kleines 词典 。 
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